Uncategorized

Scraping: «Robé los datos de 700 millones de usuarios de LinkedIn por diversión»

¿Cuántos datos personales publicaste en las redes sociales? ¿Nombre, lugar de residencia, edad, cargo, estado civil, foto de perfil? La cantidad de información que compartimos y lo cómodos que nos sentimos al respecto varía de un usuario a otro. Pero la mayoría de la gente admite que todo lo que aparece en la información pública pertenece al campo general. Entonces, ¿cómo se sentiría si un pirata informático recopilara toda su información disponible y la incluyera en una enorme hoja de cálculo junto con los datos de millones de usuarios y luego la vendiera al mejor postor de Internet? Esto es exactamente lo que hizo el mes pasado el autoproclamado «Tom Rainer». Agregó información de 700 millones de usuarios de LinkedIn en todo el mundo en una base de datos y la vendió por alrededor de $ 5,000. Hizo esto «por diversión».

A las 8:57 am, hora del Reino Unido, la publicación apareció en un conocido foro de hackers. Para los hackers, esta es una era civilizada extraña, pero ciertamente no sabemos en qué zona horaria vive el hacker que se hace llamar Tom Liner. «Hola, tengo 700 millones de registros de LinkedIn en 2021», escribió. La publicación contiene un enlace a 1 millón de muestras e invita a otros piratas informáticos a comunicarse con él en privado y proporcionar una cotización para la base de datos.

Clientes satisfechos

Estas bases de datos no se crean al irrumpir en los servidores o sitios web de las redes sociales.

En gran parte, el scraping raspado web se hace «raspando» la superficie pública de las plataformas que utilizan programas automáticos para tomar cualquier información que esté disponible sobre los usuarios.

En teoría, la mayoría de los datos se pueden encontrar simplemente seleccionando perfiles individuales de redes sociales. Aunque, por supuesto, se necesitaría muchísimo tiempo para recopilar todos los datos que son capaces de seleccionar los piratas informáticos.

En lo que va del año, ha habido otros tres incidentes importantes de scraping:

  • En abril, un hacker vendió otra base de datos de unos 500 millones de registros extraídos de LinkedIn.
  • En la misma semana, otro hacker publicó una base de datos de información extraída de 1,3 millones de perfiles de Clubhouse en un foro de forma gratuita.
  • También en abril, se recopilaron 533 millones de datos de usuarios de Facebook a partir de una mezcla de scraping antiguo y nuevo antes de ser entregados en un foro de piratería pidiendo donaciones.

El hacker responsable de la base de datos de Facebook también es «Tom Liner». Hablé con Tom en Telegram durante tres semanas. Algunos mensajes, incluso llamadas perdidas, se enviaron en medio de la noche y en otras horas de trabajo, así que no sé dónde están. La única pista sobre su vida es que me dijo que no puede llamar porque su esposa está durmiendo, él tiene un trabajo diario y los hackers son su «hobby».

UN TRABAJO MUY COMPLEJO

Tom me dijo que usó 700 millones de registros de LinkedIn para crear esta base de datos y que la tecnología utilizada era «casi exactamente la misma que la tecnología que usó para crear listados de Facebook». «Me tomó unos meses hacer esto. Es muy complicado. Tuve que piratear la API de LinkedIn. Si haces demasiadas solicitudes de datos de usuario al mismo tiempo, el sistema te prohibirá permanentemente», dijo. API son las siglas de Application Programming Interface. La mayoría de las redes sociales venden asociaciones de API, lo que permite a otras empresas acceder a los datos de la plataforma, por ejemplo, para marketing o creación de aplicaciones.

Privacy Shark, el sitio web de seguridad digital que descubrió por primera vez las ventas de bases de datos, verificó las muestras gratuitas y descubrió que contenían nombres completos, direcciones de correo electrónico, género, números de teléfono e información de la industria.

No fue una filtración de datos

LinkedIn declaró que su investigación mostró que Tom Liner no usó su API, pero confirmó que el conjunto de datos «incluye información recopilada de LinkedIn, así como información recopilada de otras fuentes». «Esta no es una filtración de datos de LinkedIn, ni se han filtrado los datos privados de los miembros de LinkedIn. La minería de datos de LinkedIn viola nuestros términos de servicio, y hemos estado trabajando duro para asegurar que la privacidad de nuestros miembros esté protegida». . Facebook emitió una declaración similar con respecto al incidente de abril. Sin embargo, el hecho de que los piratas informáticos ganen dinero con estas bases de datos preocupa a algunos expertos en Internet.

Los datos son públicos

El experto en seguridad cibernética Troy Hunt (Troy Hunt) pasa la mayor parte de su tiempo de trabajo analizando el contenido de bases de datos pirateadas. No está tan preocupado por los incidentes de rastreo recientes y dijo que deberíamos aceptarlos porque nuestra información personal es pública. «Esto definitivamente no es una infracción. De todos modos, la mayoría de los datos son públicos». «La pregunta que hay que hacerse en cada caso es cuánta de esta información elige el usuario que sea de acceso público y cuánta información no se espera que sea de acceso público».

Troy estuvo de acuerdo con la opinión de Amir de que es necesario mejorar el control de las redes sociales y dijo que no podemos ignorar estos incidentes. «No tengo ninguna objeción a la posición de Facebook y otras empresas, pero creo que la respuesta a ‘esto no es una pregunta’, aunque puede ser técnicamente precisa, es imposible rastrear cómo se ven los datos y puede minimizarlos en la creación de estas bases de datos «. Es probable que Tom sea procesado por robo de derechos de propiedad intelectual o infracción de derechos. Pero cuando le preguntaron si le preocupaba que lo arrestaran, me dijo que nadie podía encontrarlo y terminó nuestra conversación con un «Te deseo un buen momento».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *