Filtrar IPs desde uno o varios archivos
Si se quiere extraer una lista de IPs desde un sitio web y generar un archivo plano con todas las IPs indicadas, para ser bloqueadas. Documento el procedimiento mas eficiente que conozco, a continuación:
En el Caso de Ejemplo, las lista se encuentran en varias ubicaciones de
un sitio como se muestra a continuación:
http://www.hackingballz.com/herramientas/proxys/index.html
http://www.hackingballz.com/herramientas/proxys/index_2.html
http://www.hackingballz.com/herramientas/proxys/index_3.html
... etc
Entonces:
1.- Abrir un terminal en linux
2.- Crear una carpeta. "mkdir Carpeta"
3.- Ubicarse en la carpeta "cd Carpeta"
4.- Ejecutar "wget
http://www.hackingballz.com/herramientas/proxys/index.html"
5.- Repetir el paso 4, para todos los links con lista de IPs, es decir:
"wget http://www.hackingballz.com/herramientas/proxys/index_2.html"
"wget http://www.hackingballz.com/herramientas/proxys/index_3.html"
...etc
6.- Una vez descargados todos los archivos .html, ejecutar el siguiente
comando:
"cat * | grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}' >> ProxysBloquear.txt"
Para filtrar todo el contenido de los archivos .html, según la
expresión regular que aplica a las direcciones IP.
7.- Editar el archivo generado. "vim ProxysBloquear.txt"
8.- Si se desea ordenar las IPs ":%sort"
9.- Es posible que se encuentren IPs repetidas, para eliminarlas se
introduce en vim, la siguiente instrucción:
":%s/^\(.*\)\n\1/\1/"
10.- Finalmente ":wq!" para guardar y cerrar el archivo.
Listo !!
En el Caso de Ejemplo, las lista se encuentran en varias ubicaciones de
un sitio como se muestra a continuación:
http://www.hackingballz.com/herramientas/proxys/index.html
http://www.hackingballz.com/herramientas/proxys/index_2.html
http://www.hackingballz.com/herramientas/proxys/index_3.html
... etc
Entonces:
1.- Abrir un terminal en linux
2.- Crear una carpeta. "mkdir Carpeta"
3.- Ubicarse en la carpeta "cd Carpeta"
4.- Ejecutar "wget
http://www.hackingballz.com/herramientas/proxys/index.html"
5.- Repetir el paso 4, para todos los links con lista de IPs, es decir:
"wget http://www.hackingballz.com/herramientas/proxys/index_2.html"
"wget http://www.hackingballz.com/herramientas/proxys/index_3.html"
...etc
6.- Una vez descargados todos los archivos .html, ejecutar el siguiente
comando:
"cat * | grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}' >> ProxysBloquear.txt"
Para filtrar todo el contenido de los archivos .html, según la
expresión regular que aplica a las direcciones IP.
7.- Editar el archivo generado. "vim ProxysBloquear.txt"
8.- Si se desea ordenar las IPs ":%sort"
9.- Es posible que se encuentren IPs repetidas, para eliminarlas se
introduce en vim, la siguiente instrucción:
":%s/^\(.*\)\n\1/\1/"
10.- Finalmente ":wq!" para guardar y cerrar el archivo.
Listo !!
Comentarios