Filtrar IPs desde uno o varios archivos

Si se quiere extraer una lista de IPs desde un sitio web y generar un archivo plano con todas las IPs indicadas, para ser bloqueadas. Documento el procedimiento mas eficiente que conozco, a continuación:

En el Caso de Ejemplo, las lista se encuentran en varias ubicaciones de
un sitio como se muestra a continuación:

http://www.hackingballz.com/herramientas/proxys/index.html
http://www.hackingballz.com/herramientas/proxys/index_2.html
http://www.hackingballz.com/herramientas/proxys/index_3.html
... etc

Entonces:

1.- Abrir un terminal en linux

2.- Crear una carpeta. "mkdir Carpeta"

3.- Ubicarse en la carpeta "cd Carpeta"

4.- Ejecutar "wget
http://www.hackingballz.com/herramientas/proxys/index.html"

5.- Repetir el paso 4, para todos los links con lista de IPs, es decir:
"wget http://www.hackingballz.com/herramientas/proxys/index_2.html"
"wget http://www.hackingballz.com/herramientas/proxys/index_3.html"
...etc

6.- Una vez descargados todos los archivos .html, ejecutar el siguiente
comando:

"cat * | grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}' >> ProxysBloquear.txt"

Para filtrar todo el contenido de los archivos .html, según la
expresión regular que aplica a las direcciones IP.

7.- Editar el archivo generado. "vim ProxysBloquear.txt"

8.- Si se desea ordenar las IPs ":%sort"

9.- Es posible que se encuentren IPs repetidas, para eliminarlas se
introduce en vim, la siguiente instrucción:

":%s/^\(.*\)\n\1/\1/"

10.- Finalmente ":wq!" para guardar y cerrar el archivo.


Listo !!

Comentarios

Entradas populares de este blog

Configuración de Squid.

"Excelente" Seguridad de Windows O.S.

VirtualBox - BRIDGED INTERFACE