TOTALMEDIOS -El dilema de los datos: del Data Lake al Data Warehouse

Mediakits Comerciales
Directorios
Enlaces a medios del Mundo
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Noticias
- Medios
- Research
- Campañas
- Empresarias
- Agencias
- Premiaciones
- Capacitación
- Entrevistas
- Opinión
Empresarias PGD lanza la segunda edición del Media Camp para fortalecer el talento digital en Colombia

Campañas Motorola y Pantone presentan Cloud Dancer, el Color del Año 2026

Empresarias Grupo Gestión anticipa las tendencias de RRHH para 2026: un equilibrio entre tecnología y humanidad

Buscar Noticias

¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Multimedia

Tu cuenta de hoy, pensando e...
Agencia:

Marca:Prex

Soporte:

“Eclipsados”
Agencia:Isla

Marca:Ypf

Soporte:Tv, redes sociales, vía pública

"Qué lindo es que sea fáci...
Agencia:Nx lab

Marca:Naranja x

Soporte:Tv y web

"Un minuto de no silencio"
Agencia:Fundación vicki bernadet

Marca:Oglivy españa

Soporte:Tv y web

"Not para Fantasmear"
Agencia:Febrero made

Marca:Tvs motos argentina

Soporte:Tv y web

¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir

Ver todos
RRHH
Empleos destacados
- Lince consultoraDirector/a creativo de contenido audiovisual
- Grupo AlterEjecutivo Zonal
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Tarifas de publicidad

Periódicos
- Capital Federal
- GBA
  
  Avellaneda
  
  Berisso
  
  Escobar
  
  Esteban Echeverrí...
  
  Ezeiza
  
  Florencio Varela
  
  General Rodriguez
  
  Hurlingham
  
  Ituzaingó
  
  Lomas de Zamora
  
  Luján
  
  Morón
  
  Pilar
  
  Remedios de Escala...
  
  San Martin
  
  Villa Ballester
  
  Almirante Brown
  
  San Justo
- Interior
  
  Buenos Aires
  
  Catamarca
  
  Chaco
  
  Chubut
  
  Córdoba
  
  Corrientes
  
  Entre Rios
  
  Formosa
  
  Jujuy
  
  La Pampa
  
  La Rioja
  
  Mendoza
  
  Misiones
  
  Neuquén
  
  Rio Negro
  
  Salta
  
  San Juan
  
  San Luis
  
  Santa Cruz
  
  Ver todos
  
  Santa Fe
  
  Santiago del Ester...
  
  Tierra del Fuego
- Exterior
  
  Bolivia
  
  Brasil
  
  Chile
  
  Colombia
  
  Costa Rica
  
  Dominicana
  
  Ecuador
  
  El Salvador
  
  Guatemala
  
  Honduras
  
  Nicaragua
  
  Panamá
  
  Paraguay
  
  Puerto Rico
  
  Perú
  
  Uruguay
  
  Venezuela
  
  Canadá
  
  México
  
  Ver todos
  
  Trinidad y Tobago
  
  Estados Unidos
  
  África
- Distribución Conjunta
- Semanarios y Mensuarios
¿Qué información puedo encontrar en Periódicos?
Datos de contactos

Aniversarios

Perfil de lectores

Info para envío del material

Distribución

Suplementos

Tirada y circulación

Staff

Tarifas de publicidad

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Revistas
- Argentina
  
  Adolescentes
  
  Agricultura / Ganadería / R...
  
  Autos / Motos
  
  Arquitectura / Deco / Jardin...
  
  Deportes
  
  Interés General
  
  Moda / Hogar
  
  Niños / Didácticas
  
  Placer / Estilo / Ocio
  
  Política / Economía / Nego...
  
  Salud / Bienestar
  
  Técnica / Especializada / P...
  
  Tiempo Libre / Turismo
  
  Ver todos
  
  Cultura
  
  Barcos / Náutica
  
  Gratuitas
- Exterior
¿Qué información puedo encontrar en Revistas?
Datos de contactos

Aniversarios

Perfil de lectores

Info para envío del material

Distribución

Tirada y circulación

Ediciones especiales

Staff

Tarifas de publicidad

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Cable
¿Qué información puedo encontrar en Cable?
Datos de contactos

Aniversarios

Perfil de audiencia

Info para envío del material

Alcance y cobertura

Programación destacada

Staff

Tarifas de publicidad

PNT

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
TV
- Capital Federal
- Interior
  
  Buenos Aires
  
  Catamarca
  
  Chaco
  
  Chubut
  
  Córdoba
  
  Corrientes
  
  Entre Ríos
  
  Formosa
  
  Jujuy
  
  La Pampa
  
  La Rioja
  
  Mendoza
  
  Misiones
  
  Neuquén
  
  Río Negro
  
  Salta
  
  San Juan
  
  San Luis
  
  Santa Cruz
  
  Ver todos
  
  Santa Fe
  
  Santiago del Ester...
  
  Tierra del Fuego
- Productoras
¿Qué información puedo encontrar en TV?
Datos de contactos

Aniversarios

Perfil de audiencia

Info para envío del material

Alcance y cobertura

Programación destacada

Staff

Tarifas de publicidad

Grillas de programaciÓn

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Radios
- Capital Federal
  
  Radios AM
  
  Radios FM
- Interior
  
  Buenos Aires
  
  Catamarca
  
  Chaco
  
  Chubut
  
  Córdoba
  
  Corrientes
  
  Entre Rios
  
  Formosa
  
  Jujuy
  
  La Pampa
  
  La Rioja
  
  Mendoza
  
  Misiones
  
  Neuquén
  
  Rio Negro
  
  Salta
  
  San Juan
  
  San Luis
  
  Santa Cruz
  
  Ver todos
  
  Santa Fe
  
  Santiago del Ester...
  
  Tierra del Fuego
- GBA
  
  Avellaneda
  
  Berazategui
  
  Berisso
  
  Escobar
  
  Florencio Varela
  
  General Rodriguez
  
  Hurlingham
  
  Ituzaingó
  
  José C. Paz
  
  La Matanza
  
  Malvinas Argentina...
  
  Moreno
  
  Morón
  
  Pilar
  
  Quilmes
  
  Rafael Castillo
  
  Ramos Mejía
  
  San Isidro
  
  San Justo
  
  Ver todos
  
  San Martín
  
  San Miguel
  
  Sarandí
- Exterior
  
  Uruguay
  
  España
  
  Paraguay
¿Qué información puedo encontrar en Radios?
Datos de contactos

Aniversarios

Perfil de audiencia

Info para envío del material

Alcance y cobertura

Programación destacada

Staff

Tarifas de publicidad

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Publicidad exterior
Internet
¿Qué información puedo encontrar en Internet?
Datos de contactos

Aniversarios

Perfil de Usuarios

Info para envío del material

Alcance y cobertura

Dispositivos publicitarios

Staff

Tarifas de publicidad

Tráfico de Usuarios

Grupo asociado al medio

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Indoor
Cines
Estadios
Publicidad en Transportes
¿Qué información puedo encontrar en Publicidad en Transportes?
Datos de contactos

Aniversario del medio

Área de cobertura

Soportes y características

Circuitos publicitarios

Info para envío del material

Staff

Tarifas de publicidad

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Alternativos
- Medios Alternativos
¿Qué información puedo encontrar en Alternativos?
Perfil de público

Área de Cobertura

Tarifas de publicidad

Características de envío de material

Dispositivos Publicitarios

Staff

Grupo asociado al medio

Aniversarios

Datos de contactos

y mucho más!
¿Todavía no tiene su suscripción?

Suscríbase a la guía de medios de comunicación más completa.
Suscribir
Mobile

Ingreso de Usuarios

¿Olvidó su contraseña? ¿Olvidó su Usuario y Contraseña?

27.09.2023 por TOTALMEDIOS

El dilema de los datos: del Data Lake al Data Warehouse

En un mundo dominado por los datos, ¿cómo balancear entre pocos datos y estar inundado por ellos? Diego Lis, CTO de Seenka Media Data, analiza soluciones a este dilema, partiendo de un Data Lake y llegando a un Data Warehouse, listo para ofrecer información valiosa y oportuna.

Por Diego Lis, CTO de Seenka Media Data

En un mundo dominado por los datos, enfrentamos un desafío: ¿Cómo balancear entre tener pocos datos y estar inundado por ellos? ¿De qué sirve tener muchos datos si no se usan? ¿Cómo diferenciar la paja del trigo?

Orillando el problema

Digamos que quieres conocer la presencia de tu marca en los medios. Tal vez necesitas entender cómo impacta esta presencia en tus ventas, optimizar tu inversión o comparar tu estrategia con la de tu competencia. En cualquier caso, vas a necesitar datos.

Contactas algunas agencias y proveedores y compras un CSV con datos del último trimestre. Luego de algunas semanas de análisis, compruebas que en ese trimestre has perdido decenas de oportunidades. Tomas nota de algunos aprendizajes, pero sabes que esas oportunidades no volverán a aparecer. Comprendes que la información la necesitas en tiempo real.

En busca de más

Por suerte, hay un mundo enorme de datos ahí afuera, esperando ser capturados y analizados. Mediante el método de scraping, capturas noticias de portales, contenido de redes sociales, e incluso te aventuras en el mundo de las señales audiovisuales como YouTube, televisión y radio.

Luego de un año de trabajo, ya tienes funcionando todos los crawlers que trabajarán día y noche. Decides almacenar la información en una base de datos no relacional que permite escalar en volumen y tener flexibilidad en el esquema de datos como Elastic Search o MongoDB.

Además, utilizas un Bucket de Google Storage o S3 para guardar la información audiovisual de manera fiable y performante. Creas así un Data Lake, es decir, un repositorio centralizado de datos en bruto.

Al poco tiempo tu Data Lake tiene millones de datos esperando que los uses. Sin embargo, la información que proviene de los medios es completamente heterogénea. Contiene textos, imágenes, audios, videos, cortos y largos, bien y mal escritos, etc. Necesitas, en efecto, transformar estos datos para normalizarlos y poder consumirlos de manera más homogénea.

Dando sentido a tus datos

La normalización de un dataset es particularmente importante en el caso de los medios. ¿De qué me sirve obtener diariamente el texto de miles de noticias si no sé a quién se menciona y de qué temática se habla? ¿Para qué saber que se han emitido cierta cantidad de publicidades si no puedo identificar cuál es la marca, el mensaje central de la misma, su audiencia e impacto?

Afortunadamente, viene a tu rescate el Machine Learning. En los últimos años, viene creciendo de manera exponencial el interés por este campo en el ámbito académico y en la industria. En este gráfico, podemos ver la cantidad de papers de inteligencia artificial que se han publicado en el sitio arXiv en los últimos 30 años.

Decides entonces contratar un equipo especializado de ingenieros de machine learning. Luego de dos años de trabajo aplicando decenas de técnicas, logras convertir tus datos "no estructurados" en datos "estructurados". Es decir, le das sentido a tus datos.

Y así decides utilizar un motor de base de datos relacional, como PostgreSQL o MySQL, donde vas guardando la información estructurada, normalizada y homogénea, para facilitar su análisis posterior. Estás por cantar victoria cuando descubres algo inquietante: la cantidad de datos que has acumulado, que ya llega a los centenares de millones, es tan grande que resulta demasiado lento hacer cualquier consulta medianamente compleja.

La etapa final: El Data Warehouse

Por fin, logras implementar una última etapa en tu pipeline: utilizas un base de datos orientada a columnas, como BigQuery o ClickHouse, para crear un Data Warehouse, es decir, una base de datos optimizada para el análisis y generación de informes.

En esta nota:

Seenka

Data

Te puede interesar

Comscore y Seenka se asocian para potenciar la planificación de campañas en la región

Seenka lanza Creative Sense, la plataforma que centraliza el acceso al universo publicitario

Informe Seenka y cómo fue la inversión publicitaria de julio en Ciudad de Buenos Aires

Seenka integra a adCuality y consolida su liderazgo en monitoreo cross-media real time en América Latina

Seenka analiza el avance de la IA generativa y su impacto en la productividad empresarial

Informe Seenka: Los números de la publicidad en canales de Streaming continúan creciendo

Otras noticias del día

Premiaciones

Todos los nominados de los Premios Olimpia 2025

La Comisión de los Premios Olimpia anunció las ternas de los Premios Olimpia 2025, cuya ceremonia se realizará el lunes 22 de diciembre en la Usina del Arte, un escenario que volverá a reunir a las figuras más destacadas del deporte argentino. Ver más

Medios

“Se Siente Argentina” celebra un año de Folklore con una fiesta especial

Este sábado hay fiesta en Televisión Pública con dos horas a plena música, con la visita de Víctor Hugo Godoy, Cuti y Roberto Carabajal, Yamila Cafrune, Bruno Arias y Motta Luna, Campedrinos, Ceibo, Los Caldenes, Flor Paz, Chaco Andrada, Franco Massignani y El Entrevero. Ver más

Campañas

Sertal suma un segmento propio en Urbana Play dentro de Vuelta y Media

Sertal presentó en Urbana Play el segmento “El Dolor de Panza de la Semana”, un espacio creado para integrarse al programa Vuelta y Media y reforzar el posicionamiento de la marca. La iniciativa, desarrollada junto a #urbanaplaylab y Midios, propone abordar situaciones cotidianas con humor y cercanía. Ver más

Noticias por segmento

multimedia / campañas publicitarias

Tu cuenta de hoy, pensando en mañana

Agencia: Marca: Prex Soporte:

Prex presenta “Tu cuenta de hoy, pensando en mañana”, una campaña 360° que marca su décimo aniversario y destaca la evolución de la fintech junto a los usuarios uruguayos. Desarrollada internamente y producida por Pardelion Films, la propuesta pone en foco la cercanía, la innovación y el rol de Prex en la transformación de las finanzas digitales del país.

“Eclipsados”

Agencia:Isla

Marca:Ypf

Soporte:Tv, redes sociales, vía pública

"Qué lindo es que sea fácil, qué lindo es poder"

Agencia:Nx lab

Marca:Naranja x

Soporte:Tv y web

"Un minuto de no silencio"

Agencia:Fundación vicki bernadet

Marca:Oglivy españa

Soporte:Tv y web

"Not para Fantasmear"

Agencia:Febrero made

Marca:Tvs motos argentina

Soporte:Tv y web

Ver todos

Suscribite a nuestro canal

Enlaces a medios del Mundo

¿Todavía no tiene su suscripción?

Buscar Noticias

¿Todavía no tiene su suscripción?

¿Todavía no tiene su suscripción?

Empleos destacados

¿Todavía no tiene su suscripción?

Periódicos

¿Qué información puedo encontrar en Periódicos?

¿Todavía no tiene su suscripción?

Revistas

¿Qué información puedo encontrar en Revistas?

¿Todavía no tiene su suscripción?

Cable

¿Qué información puedo encontrar en Cable?

¿Todavía no tiene su suscripción?

TV

¿Qué información puedo encontrar en TV?

¿Todavía no tiene su suscripción?

Radios

¿Qué información puedo encontrar en Radios?

¿Todavía no tiene su suscripción?

Publicidad exterior

Internet

¿Qué información puedo encontrar en Internet?

¿Todavía no tiene su suscripción?

Indoor

Cines

Estadios

Publicidad en Transportes

¿Qué información puedo encontrar en Publicidad en Transportes?

¿Todavía no tiene su suscripción?

Alternativos

¿Qué información puedo encontrar en Alternativos?

¿Todavía no tiene su suscripción?

Mobile

Ingreso de Usuarios

Buscar Noticias

El dilema de los datos: del Data Lake al Data Warehouse

Te puede interesar

Otras noticias del día

Noticias por segmento

Lo más leído

Recientes

Video del día

multimedia / campañas publicitarias

Tu cuenta de hoy, pensando en mañana