Que é exactamente 'Big Data'?

E por que é un gran negocio?

"Grandes datos" é a nova ciencia de comprender e predicir o comportamento humano ao estudar grandes volumes de datos non estruturados. Os grandes datos tamén son coñecidos como "análise preditiva".

Analizando publicacións de Twitter, fontes de Facebook, buscas de eBay, seguidores de GPS e cajeros automáticos son algúns exemplos de datos. O estudo de vídeos de seguridade, datos de tráfico, patróns meteorolóxicos, chegadas de voo, rexistros de torre de telefonía móbil e seguidores de frecuencia cardíaca son outras formas. Os grandes datos son unha nova ciencia desordenada que cambia semanalmente e só algúns expertos entenden todo.

Cales son algúns exemplos de grandes datos na vida normal?

captura de pantalla http://project.wnyc.org/transit-time

Aínda que os grandes proxectos de datos son moi escuros, hai exemplos exitosos de grandes datos que afectan á vida cotiá de individuos, empresas e gobernos:

Predición de brotes de virus: estudando datos socio-políticos, datos meteorolóxicos e climáticos e datos hospitalarios e clínicos, estes científicos están agora a predicir brotes de febre de dengue con aviso previo de 4 semanas.

Homicide Watch: este gran proxecto de datos perfila vítimas de homicidios, sospeitosos e criminais en Washington, DC. Tanto como forma de honrar ao falecido e como recurso de sensibilización para as persoas, este gran proxecto de datos é fascinante.

Transit Travel Planning, NYC: o programador de radio WNYC Steve Melendez combinou o horario de metro en liña co software de itinerario de viaxes. A súa creación permite aos neoyorquinos facer clic na súa localización no mapa e aparecerá unha predición do tempo de viaxe para trens e metro.

Xerox reduciu a súa perda de persoal: o traballo do centro de atención telefónica é emocionalmente agotador. Xerox estudou ensaios de datos coa axuda de analistas profesionais e agora poden predecir cales contas de centros de chamadas poden quedar coa compañía o máis longo.

Apoio ao contra-terrorismo: estudando medios sociais, rexistros financeiros, reservas de voos e datos de seguridade, a aplicación da lei pode predecir e localizar a sospeitosos do terrorismo antes de que realicen os seus actos malvados.

Axustar o marketing da marca baseado nas reseñas de redes sociais : as persoas comparten de forma brusca e rápida os seus pensamentos en liña nun pub, restaurante ou gimnasio. É posible estudar estes millóns de mensaxes en redes sociais e proporcionar comentarios á empresa sobre o que a xente pensa nos seus servizos.

Quen usa grandes datos? Que fan eles?

Moitas empresas monolíticas usan grandes datos para axustar as súas ofertas e prezos para maximizar a satisfacción do cliente.

Por que hai grandes datos como un gran negocio?

4 cousas fan importantes datos importantes:

1. Os datos son enormes. Non caberá nun único disco duro , nin moito menos un dispositivo USB . O volume de datos supera o que a mente humana pode percibir (pensa en mil millóns de millóns de megabytes e multiplíquese por máis millóns).

2. Os datos son desordenados e desestructurados. O 50% ao 80% do gran traballo de datos é a conversión e limpeza da información para que poida ser investigada e ordenada. Só algúns miles de expertos do noso planeta saben perfectamente como facer esta limpeza de datos. Estes expertos tamén precisan ferramentas moi especializadas, como HPE e Hadoop, para facer o seu oficio. Quizais en 10 anos, os grandes expertos de datos converteranse nunha centavo de unha ducia, pero por agora son unha especie de analista moi rara ea súa obra é aínda moi escura e tediosa.

3. Os datos convertéronse nunha mercadoría ** que se pode vender e comprar. Existen mercados de datos onde as empresas e os individuos poden comprar terabytes de redes sociais e outros datos. A maioría dos datos están baseados na nube, xa que é demasiado grande para caber en calquera disco duro. A compra dos datos normalmente implica unha taxa de subscrición na que se conecta a unha granxa de servidores de nube.

** Os líderes das grandes ferramentas e ideas de datos son Amazon, Google, Facebook e Yahoo. Debido a que estas empresas atenden a tantos millóns de persoas cos seus servizos en liña, ten sentido que serían o punto de recolleita e os visionarios detrás das grandes analíticas de datos.

4. As posibilidades de grandes datos son infinitas. Quizais os médicos algún día preverán ataques cardíacos e accidentes cerebrovasculares para individuos semanas antes de que isto ocorra. O avión e os accidentes automovilísticos poden reducirse mediante análises preditivas dos seus datos mecánicos e os patróns de tráfico e clima. O mozo en liña pode mellorarse con grandes predicadores de datos de quen son personalidades compatibles para ti. Os músicos poderían entender o que a composición musical é o máis agradable aos gustos cambiantes do público obxectivo. Os nutricionistas poderían prever cal combinación de alimentos comprados na tenda vai agravar ou axudar ás condicións médicas dunha persoa. A superficie só quedou rabuñada e os descubrimentos en grandes datos ocorren cada semana.

Big Data é desordenado

Monty Rakusen / Getty

Os grandes datos son analíticos predictivos: a conversión de datos non estruturais masivos en algo que se pode buscar e ordenar. Este é un espazo desordenado e caótico que require un coñecemento especial e paciencia.

Tomemos por exemplo o servizo monolítico de entrega UPS. Os programadores de UPS estudan datos do GPS dos seus condutores e teléfonos intelixentes para analizar as formas máis eficientes de adaptarse á conxestión do tráfico. Este GPS e os datos do teléfono intelixente son gargantuan e non están preparados para a súa análise automáticamente. Este dato vén de varias bases de datos GPS e mapas, a través de diferentes dispositivos de hardware para smartphones. Os analistas de UPS pasaron meses convertendo todos os datos nun formato que se pode buscar e ordenar facilmente. O esforzo valeu a pena. Hoxe, o UPS salvou máis de 8 millóns de litros de combustible desde que empezaron a usar estas grandes análises de datos.

Porque os grandes datos son desordenados e requiren tanto esforzo para limpar e prepararse para o seu uso, os científicos de datos converteuse en apelidos de "conserxadores de datos" por todo o traballo tedioso que fan. El

A ciencia de grandes datos e analítica preditiva é mellorar cada semana. Espere grandes datos para que sexan accesibles para todos ao ano 2025.

Non se trata de Big Data unha ameaza intrusa contra privacidad?

Feingersh / Getty

Si, se as nosas leis e as defensas de privacidade individuais non son coidadosamente xestionadas, os grandes datos inféctanse na privacidade persoal. Como está de moda, Google e YouTube e Facebook xa rastrexan os seus hábitos diarios en liña . O teu teléfono intelixente e a vida informática deixan as pegadas dixitais todos os días, e as empresas sofisticadas están estudando esas pegadas.

As leis en torno a grandes datos están evolucionando. A privacidade é un estado de ser que agora debe asumir a responsabilidade persoal, xa que xa non pode esperalo como un dereito por defecto.

O que podes facer para protexer a túa privacidade:

O maior paso único que pode tomar é manter os seus hábitos cotiáns usando unha conexión de rede VPN . Un servizo VPN combinará o seu sinal para que a súa identidade e localización estean, polo menos parcialmente, enmascarados dos rastreadores. Isto non o fará 100% anónimo, pero unha VPN reducirá substancialmente o que o mundo pode observar os seus hábitos en liña.

Onde podo aprender máis sobre grandes datos?

Monty Raskusen / Getty

Os grandes datos son algo fascinante para as persoas con mentalidades analíticas e un amor pola tecnoloxía. Se iso é así, definitivamente visite esta páxina de interesantes proxectos de grandes datos.