"¿Esto que queremos hacer es legal?" es la primera pregunta correcta antes de encarar cualquier proyecto de extracción de datos. El web scraping —la extracción automatizada de datos de sitios web— es legal en Argentina y en la mayoría de LATAM cuando se extraen datos públicos no personales, sin eludir medidas de seguridad y sin dañar el sitio consultado. Se vuelve riesgoso cuando involucra datos personales (regulados por la Ley 25.326 y sus equivalentes regionales), contenido protegido por derecho de autor o violación de términos de servicio aceptados. Esta guía traza las líneas con la mayor precisión posible — aclarando que es orientación general, no asesoramiento legal para tu caso puntual.
Qué es el web scraping y por qué tu empresa quizás ya lo necesita
Scraping es hacer con un programa lo que un humano haría con el navegador: visitar páginas, leer datos y copiarlos a una planilla o base de datos. La diferencia es la escala: donde una persona releva 50 precios por hora, un scraper releva 50.000, todos los días, sin errores de tipeo. Es una de las herramientas clásicas de la automatización programática.
Los usos legítimos más comunes que implementamos:
- Monitoreo de precios de la competencia: saber cada mañana cómo está posicionado tu catálogo contra el mercado.
- Agregación de datos públicos: licitaciones, boletines oficiales, normativa, registros públicos, datos abiertos de gobierno.
- Inteligencia de mercado: publicaciones inmobiliarias, avisos de empleo, disponibilidad de productos en marketplaces.
- Control de marca y distribuidores: detectar quién vende tu producto fuera de precio o sin autorización.
El marco legal en Argentina: las tres capas que importan
No hay una "ley de scraping". Lo que hay son tres marcos que se cruzan:
1. Datos personales — Ley 25.326. La línea más importante. Si lo que extraés identifica personas (nombres, mails, teléfonos, perfiles, fotos), estás tratando datos personales y la ley aplica completa: necesitás una base legal, una finalidad legítima y declarada, y responder a derechos de acceso y supresión. "Estaba público en internet" no equivale a consentimiento — este es el malentendido más caro del rubro. Armar bases de prospección scrapeando mails y teléfonos es, directamente, la zona de mayor riesgo.
2. Términos de servicio. Casi todos los sitios grandes prohíben el scraping en sus términos. Es un plano contractual: la consecuencia típica es el bloqueo de tu acceso o un reclamo civil, no una causa penal. El riesgo es bajo si navegás contenido público sin cuenta, y alto si creaste una cuenta y aceptaste términos expresamente (LinkedIn, Instagram, marketplaces logueado).
3. Acceso indebido y daño informático. El Código Penal castiga el acceso ilegítimo a sistemas restringidos. Scrapear contenido público no encaja ahí; eludir contraseñas, paywalls o bloqueos técnicos para llegar a contenido restringido sí puede encajar, además de tumbar un sitio por exceso de requests, que genera responsabilidad por daños.
Cómo es el panorama en el resto de LATAM
| País | Norma de datos personales | Nota práctica para scraping |
|---|---|---|
| Argentina | Ley 25.326 (1853 si avanza su reforma) | Datos personales públicos siguen protegidos |
| Brasil | LGPD (Ley 13.709) | La más estricta y la más fiscalizada de la región; multas de hasta 2% de facturación |
| México | LFPDPPP | Exige aviso de privacidad para cualquier tratamiento |
| Colombia | Ley 1581 de 2012 | Principio de finalidad estricto; la SIC sanciona activamente |
| Chile | Ley 21.719 (reemplaza la 19.628) | Régimen nuevo con agencia y multas reales desde 2026 |
| Perú | Ley 29733 | Similar a Argentina en estructura |
La regla transversal: los precios, productos y datos oficiales no son datos personales y su extracción es defendible en toda la región; los datos de personas están protegidos en todos lados, estén o no publicados.
¿Necesitás datos de la web pero no querés meterte en un problema? Agendá una llamada de 30 minutos y revisamos juntos si tu caso es viable y cómo encararlo bien.
Las líneas rojas: lo que no hay que hacer nunca
Para que no queden grises, esto es lo que en Deepyze no hacemos ni recomendamos:
- Recolectar datos personales masivamente para prospección (mails, teléfonos, perfiles) sin base legal. Es la infracción más común y la más sancionable.
- Eludir logins, paywalls, CAPTCHAs o bloqueos para acceder a contenido restringido. Cruza del plano contractual al penal.
- Republicar contenido protegido por derecho de autor: extraer descripciones, fotos o artículos de otro sitio y publicarlos como propios es infracción a la Ley 11.723, scraping mediante o no.
- Degradar el servicio del sitio consultado: cientos de requests por segundo pueden tirar un servidor ajeno; además de antiético, genera responsabilidad civil.
- Disfrazar el bot de usuario humano rotando identidades para evadir bloqueos explícitos: si el sitio te bloqueó, el mensaje fue claro.
Buenas prácticas técnicas del scraping ético
Estas prácticas reducen el riesgo legal y, de paso, hacen scrapers más estables:
- Antes de scrapear, buscá la API: muchos sitios ofrecen una vía oficial para los mismos datos (Mercado Libre la tiene, por ejemplo). Es más robusta y elimina la discusión legal. Explicamos la diferencia en qué es una API y cómo se usa para integrar sistemas.
- Respetá robots.txt: el archivo donde cada sitio declara qué permite consultar a bots. No es ley, pero es la referencia de buena fe que un juez y un perito van a mirar primero.
- Rate limiting: espaciar las consultas (1 request por segundo o menos es un piso razonable) y correr en horarios de baja carga del sitio.
- Identificación honesta: un user-agent que diga quién sos y cómo contactarte, en vez de simular un navegador humano.
- Cacheo: no volver a pedir lo que no cambió; menos carga para ellos, menos costo para vos.
- Minimización de datos: extraer solo los campos que tu caso de uso necesita, y descartar cualquier dato personal que venga "de yapa".
Qué mirar antes de encarar (o contratar) un proyecto de scraping
Una checklist corta para bajar el riesgo a tierra antes de escribir una línea de código:
- ¿Los datos identifican personas? Si la respuesta es sí, frená y consultá: el proyecto necesita análisis legal específico, no solo buena técnica.
- ¿Existe una vía oficial? API, dataset abierto, convenio comercial con la fuente. Revisalo primero; a veces cuesta lo mismo y elimina el problema de raíz.
- ¿Qué dicen el robots.txt y los términos del sitio? No para abandonar el proyecto ante cualquier prohibición genérica, pero sí para decidir con la información completa.
- ¿Cuánto vale el dato si la fuente te bloquea mañana? Diseñá asumiendo que puede pasar: múltiples fuentes, degradación elegante, alertas cuando la estructura del sitio cambie.
- ¿Quién mantiene el scraper? Los sitios rediseñan sus páginas sin avisar; un scraper sin mantenimiento muere en promedio a los pocos meses. Presupuestá ese acompañamiento desde el día uno.
Cuándo NO te conviene scrapear
- Si existe una API oficial o un dataset abierto con los mismos datos: usalos, siempre. Scraping es el plan B, no el A.
- Si el negocio entero depende de un solo sitio que te puede bloquear mañana: un modelo de negocio construido sobre scraping de una única fuente hostil es estructuralmente frágil.
- Si el objetivo es construir bases de contactos: hay caminos legales para generar demanda; este no es uno.
- Si los datos cambian poco: para relevar 200 precios una vez por trimestre, una persona con una planilla sigue siendo lo más razonable.
Scraping bien hecho, con quien lo hace en serio
La diferencia entre un proyecto de datos valioso y un problema legal es el diseño: qué se extrae, de dónde, a qué ritmo y con qué resguardos. En Deepyze construimos scrapers éticos y mantenibles —monitoreo de precios, agregación de datos públicos, inteligencia de mercado— como parte de nuestros servicios de automatización con IA y software a medida, con la capa de APIs e integraciones para que los datos lleguen directo a tus sistemas. Precio fijo cerrado antes de empezar, propuesta en 24 horas y un equipo en tu huso horario para ajustar el scraper cuando la fuente cambie. Contanos qué datos necesita tu negocio y te decimos con franqueza si se puede, cómo y cuánto cuesta.
Preguntas frecuentes
¿El web scraping es legal en Argentina?+
El scraping en sí no está prohibido por ninguna ley argentina: extraer datos públicos no personales (precios, productos, normativa, datos oficiales) es en general lícito. Los límites aparecen cuando se extraen datos personales sin base legal (Ley 25.326), se violan términos de servicio aceptados o se daña técnicamente al sitio.
¿Puedo scrapear los precios de mi competencia?+
El monitoreo de precios públicos es una práctica extendida y de las más defendibles legalmente: los precios son información comercial pública, no datos personales. La condición es hacerlo de forma responsable: sin eludir bloqueos técnicos, con ritmo de consultas moderado y sin copiar contenido protegido por derecho de autor.
¿Qué dice la Ley 25.326 sobre el scraping?+
La Ley 25.326 de Protección de Datos Personales no menciona el scraping, pero aplica de lleno cuando lo extraído son datos de personas: nombres, mails, teléfonos, perfiles. Tratar esos datos exige base legal, finalidad legítima y derechos de acceso y supresión, aunque estén publicados en la web.
¿Scrapear viola los términos de servicio de un sitio?+
Muchos sitios prohíben el scraping en sus términos. La violación de términos es un tema contractual, no penal: el riesgo típico es el bloqueo o un reclamo civil, no un delito. El riesgo sube mucho si creaste una cuenta y aceptaste los términos expresamente, como en LinkedIn o redes sociales.
¿Qué es el scraping ético?+
Es extraer datos respetando tres planos: legal (sin datos personales sin base legal ni elusión de medidas técnicas), contractual (consciente de los términos de cada sitio) y técnico (rate limiting, respeto del robots.txt, identificación honesta del bot y sin degradar el servicio del sitio consultado).
¿Querés que esto funcione en tu empresa?
En Deepyze convertimos procesos manuales en sistemas que trabajan solos: automatización con IA, apps web y móviles, y software a medida. Contanos tu caso y en 24 hs tenés una propuesta concreta.
Sin compromiso · Respuesta en 24 hs · Equipo en tu mismo huso horario