Hacking,  Tech

Scripts para extraer documentos

Estamos frente a una máquina, queremos extraer de ella un tipo determinado de archivos pero tenemos muy poco tiempo. Podríamos buscar en los directorios, copiar los archivos que nos interesan, comprimirlos y guardarlos en una memoria USB pero ya lo dije: tenemos muy poco tiempo. Por eso creé en Python unos scripts para extraer documentos que me permiten hacer esta tarea en segundos.

Hackear es resolver problemas técnicos de forma sencilla. Las tonterías de sótanos oscuros con diez terminales de letras verdes sobre fondos negros  y un fumador sin rostro irrumpiendo en agencias secretas del gobierno dejémoslas para Hollywood. El 95% del hacking es hacer estas pendejadas, pendejadas que nos pueden arrojar resultados muy valiosos.

El primer script lo hice pensando en extraer archivos PDF de las carpetas Documentos y Descargas, donde normalmente se guardan. Este superprograma de 33 líneas pesó 1,1 kB.

Scripts para extraer documentos

En la siguiente imagen veremos que el script funcionó de maravilla y extrajo todos los archivos con extensión .pdf de las carpetas indicadas.

Scripts para extraer archivos

Después pensé que no tenía sentido limitar la extracción a unas cuantas carpetas si podía hacerlo al nivel de todo el directorio principal. El nuevo código quedó más pequeño: 28 líneas y menos de 1 kB (906 bytes).

Script para extraer documentos

Como veremos en la siguiente imagen, ahora pude extraer más archivos que con el primer código (obvio).

Scripts para extraer documentos

Pero después pensé que siendo una operación tan rápida podía extenderla a varios tipos de archivos. Para ello agregué la siguiente línea de código: extensiones = [".pdf", ".docx", ".xlsx", ".xls", ".doc", ".jpg", ".jpeg", ".png"] y el nuevo script con 32 miserables líneas de código quedó así:

Scripts para extraer documentos

Ahora la recuperación de archivos fue una locura. Centenares de archivos comprimidos y listos para descargar. Ya valía la pena la exfiltración. En la carpeta había hojas de cálculo, correspondencia con entidades, cotizaciones, contratos, fotos, capturas de pantalla etc.

Scripts para extraer documentos

Con un script tan sencillo como este podemos hacer muchas cosas. Ahora tenía que probarlo en Mocosoft Windows que es el sistema operativo instalado en la mayoría de ordenadores personales del mundo. El resultado fue estupendo:

Script para extraer documentos

8.254 archivos extraídos en 12 segundos con un script de 32 líneas y que pesa 1 kB. Esa es la definición misma de Eficiencia. El código final fue el siguiente. Usted le puede quitar o añadir extensiones de acuerdo al tipo de archivos que esté buscando.

import os
import zipfile
# Directorio principal
directorio_principal = os.path.expanduser("~")
# Ruta de la carpeta "exif"
directorio_exif = os.path.join(directorio_principal, "exif")
# Crear la carpeta "exif" si no existe
if not os.path.exists(directorio_exif):
os.makedirs(directorio_exif)
# Extensiones de archivos a buscar
extensiones = [".pdf", ".docx", ".xlsx", ".xls", ".doc", ".jpg", ".jpeg", ".png"]
# Buscar archivos en las carpetas del directorio principal
archivos = []
for root, dirs, files in os.walk(directorio_principal):
forfileinfiles:
ext=os.path.splitext(file)[1]
ifextinextensiones:
ruta_archivo=os.path.join(root, file)
archivos.append(ruta_archivo)
# Comprimir los archivos en un archivo ZIP
archivo_zip = os.path.join(directorio_exif, "docs.zip")
with zipfile.ZipFile(archivo_zip, "w") as zipf:
forarchivoinarchivos:
zipf.write(archivo, os.path.basename(archivo))
print("Archivos comprimidos correctamente.")
Por cierto no escribí este script para robar archivos. Confesarlo en línea sería algo muy estúpido. El propósito de este código es, en primer lugar, compartir ejercicios simples pero muy prácticos de Python y, en segundo, acceder rápidamente a un tipo específico de archivos en mis propias máquinas. Aunque, pensándolo bien, también podría usarse para otros fines… Hasta la próxima.