Saltar al contenido principal

Cómo planificar eventos de datos sociales de alto volumen

Los principales eventos nacionales y globales suelen ir acompañados de marcados picos de actividad de usuarios en las plataformas de redes sociales. A veces se conocen con antelación, como el Super Bowl, las elecciones y las celebraciones de Año Nuevo en todo el mundo. Otras veces, los picos de volumen se deben a sucesos inesperados, como desastres naturales, acontecimientos políticos no previstos, momentos de la cultura popular o pandemias como la de COVID-19. Estos repuntes de actividad de usuarios pueden ser efímeros (medidos en segundos) o mantenerse durante varios minutos. Independientemente de su origen, es importante considerar el impacto que pueden tener en las aplicaciones que consumen data de X. A continuación se presentan algunas prácticas recomendadas que ayudarán a su equipo a prepararse para eventos de datos sociales de alto volumen.

Revisa tus reglas actuales del stream filtrado

  • Ciertas palabras clave pueden experimentar picos durante eventos de alto volumen, como las menciones de marca cuando una marca patrocina un evento deportivo importante.
  • Procura evitar reglas innecesarias o demasiado genéricas que puedan generar volúmenes de actividad superfluos.
  • Considera comunicarte con tus clientes antes de eventos previsiblemente de alto volumen para ayudarles a planificar adecuadamente.  

Somete tu aplicación a pruebas de carga

Prevé que los picos de volumen puedan alcanzar entre 5 y 10 veces el consumo diario promedio. Según tu conjunto de reglas, el incremento puede ser mucho mayor.

Entender los límites de entrega para las conexiones

Los límites de flujo y entrega se basan en los niveles de acceso. Esto da como resultado un volumen estático de resultados entregados para los streams.
  • Academic: 250 Posts/segundo
  • Enterprise: Los Posts/segundo se determinan según el nivel de acceso

Optimiza para mantener la conexión

Con los streams, mantener la conexión es esencial para no perder data. Tu aplicación cliente debe ser capaz de detectar una desconexión y contar con lógica para reintentar la conexión de inmediato, usando un backoff exponencial si falla el intento de reconexión.  

Agrega un almacenamiento en búfer integrado de tu lado

Crear una aplicación multihilo es una estrategia clave para manejar streams de alto volumen. A grandes rasgos, una práctica recomendada para administrar streams de datos es contar con un hilo/proceso independiente que establezca la conexión de streaming y luego escriba las actividades JSON recibidas en una estructura en memoria o en un lector de stream con búfer. Este hilo de procesamiento de stream “ligero” es responsable de manejar los datos entrantes, que pueden almacenarse en búfer en memoria, aumentando o disminuyendo según sea necesario. Luego, otro hilo consume ese flujo y realiza el “trabajo pesado” de analizar el JSON, preparar escrituras en la base de datos o cualquier otra tarea que tu aplicación deba realizar.  

Eventos globales = zonas horarias globales

Los eventos pueden producirse fuera del horario laboral o durante el fin de semana, así que asegúrate de que tu equipo esté preparado para picos fuera del horario habitual.
I