Mais do que nunca, em 2018 tem ganho proeminência no espaço público a discussão de uma série de ideias e conceitos que, aqui e ali, potenciam a afirmação de posições por vezes extremadas sobre as suas consequências no nosso quotidiano e, desde logo, qual o nosso lugar perante a tecnologia que molda e condiciona as actividades sociais, económicas e culturais. A Inteligência Artificial (IA) e a Internet das Coisas (Internet of Things – IoT) são apenas dois desses exemplos, embora há anos (nalguns casos décadas) que têm sido alvo de investigação nos domínios tecnológico e filosófico.
A expectativa é grande quanto à possibilidade da ciência da computação na concepção de dispositivos que simulem a capacidade humana de raciocinar, tomar decisões e resolver problemas, no fundo a capacidade de ser inteligente. E, ao falarmos da Internet das Coisas, as implicações que uma rede de objectos físicos por via de sensores se conseguir conectar e transmitir dados. Dito de outro modo, referimo-nos a uma extensão da Internet actual que possibilita aos objectos do dia-a-dia, com capacidade computacional, se ligarem à net, serem capazes de se identificar na rede e de comunicar entre si. Veículos, semáforos, sensores de presença, electrodomésticos e câmaras de vigilância são apenas alguns exemplos do que já hoje existe no universo IoT.
Big Data é igualmente outro tema central na abordagem aos dados, processamento e tratamento da informação em larga escala, como discutiremos adiante. Pode parecer um chavão dizer que “os dados são o ouro do século XXI”, mas essa ideia encerra em sim mesmo um aspecto vital: em boa medida, os negócios, as empresas e demais organizações só conseguirão ser verdadeiramente competitivas e capazes de triunfar se compilarem, analisarem e visualizarem a informação das múltiplas variáveis dos respectivos bens, produtos e serviços, e mercados onde operam e assim responderem de modo mais eficaz às necessidades de cada momento.
Assim sendo, compreender e dominar a tecnologia é apenas um dos pontos desta equação. As pessoas passam cada vez mais tempo no mundo online. Relativamente à ligação em rede, a Cisco estimou que entre 2008 e 2009 o número de aparelhos conectados (smartphones, etc.) se sobreporia ao número de pessoas vivas no nosso planeta. Estima-se também que em 2020 haverá 26 biliões de dispositivos na Terra, mais de três aparelhos em média por pessoa.
Mas o que significa Big Data? De acordo com De Mauro et al. (2015), a expressão está na moda tanto na indústria como na academia e, por norma, é apresentada de uma maneira muito vaga. Em si não apresenta algo completamente novo, mas tende a descrever um conjunto de situações que se estão a consolidar, que vão desde a capacidade tecnológica para armazenar, concentrar e processar dados até à mudança cultural que está a invadir o mundo empresarial e a sociedade, assente numa grande abundância de informação. Os autores referem que a grande maioria das referências a Big Data englobam-se num destes quatro temas: informação, tecnologias, métodos e impacto.
A informação é o combustível da Big Data. Ela tem vindo a tornar-se possível de aceder e manipular por via da digitalização. Um próximo nível é a datafication, ou seja, garantir um formato quantificável da informação para que a mesma possa ser tabulada e analisada. Quanto às tecnologias, o ponto aqui remete para os equipamentos e a arquitectura de sistemas que possibilitem a transmissão de grandes quantidades de dados e a monitorização de desempenho dos mesmos. No que toca aos métodos, a análise de extensas quantidades de dados requer métodos de processamento que vão além das ferramentas estatísticas tradicionais. De entre os métodos de análise da Big Data podemos referir, a título de exemplo, a fusão e integração de dados, o processamento de linguagem natural, modelos de previsão e algoritmos genéticos. Já quanto ao impacto da Big Data nas nossas vidas, um tópico primordial é o da privacidade, isto é, a garantia que temos (ou não) que os dados que partilhamos ou disponibilizamos sejam circunscritos apenas para determinados fins. Esse é, aliás, um dos principais fins da recente directiva comunitária da protecção de dados.
Na tentativa de definir o conceito, Ularu et al. (2012) consideram que a Big Data é uma expressão que comprime diferentes conjuntos de dados em grande número, altamente complexos, não – estruturados, organizados, armazenados e processados, recorrendo a métodos e técnicas específicas usadas para processos de negócios. Os dados excedem a capacidade de processamento dos sistemas de base de dados convencionais. A sua dimensão e velocidade de circulação impossibilitam que se encaixem nalgumas estruturas existentes, daí a necessidade de desenvolver novas arquitecturas.
O enquadramento e as propostas de sistematização da Big Data colocam em evidência os três V’s: Volume, Velocidade e Variedade. Muitos trabalhos assinalam isso mesmo. A quantidade de dados e a sua natureza descreve essa perspectiva do volume, que pode variar de dezenas de terabytes para centenas de petabytes para uma organização. Só para se ficar com uma ideia geral do panorama actual, a Internet é um enorme espaço onde grandes quantidades de informação são adicionadas todos os dias. De acordo com o IBM Big Data Flood Infographic (estudo citado por Ularu et al., 2012), diariamente são actualizados 100 Terabytes de dados no Facebook e estima-se que, face a uma crescente actividade nas redes sociais, se possa chegar a 35 Zettabytes de dados gerados anualmente em 2020 (ou seja, 1021 bytes). A referência ao volume de dados criados no mundo provém de inúmeras fontes que não apenas os posts nas redes sociais, mas também notícias, vídeos e fotografias digitais, registos de compras, transacções financeiras, sinais de GPS de telefones móveis, emails, informação meteorológica, entre outros.
A velocidade remete para os dados que uma organização recebe e que precisa ser trabalhada em tempo real. Já a variedade de dados não – estruturados, estruturados e semi – estruturados afecta o modo como as organizações podem sumarizar e analisar a sua informação.
Apesar de não contrariarem a concepção dos três V’s, acabando mesmo por reforçá-lo, no seu Livro Branco “Irreversible: The Public Relations Big Data Revolution”, de 2016, Mark Weiner e Sarab Kochhar discutem os desafios da Big Data no âmbito das relações públicas e o modo como as organizações podem recorrer a toda uma panóplia de instrumentos, acrescentando a acção de outro V: valor. Ou seja, o valor intrínseco dos dados ajuda as instituições a obter significado, reconhecer padrões e a tomar opções mais esclarecidas no processo de tomada de decisão. As terminologias podem inclusivamente mudar nos próximos anos, mas a necessidade de criar estratégias, colectar e analisar os dados irão tornar-se uma prioridade de topo para as organizações.
Se todo este caudal de dados, dispositivos, métodos de análise e processamento que englobam a Big Data suscitam interrogações quanto ao valor da privacidade da informação, crê-se que esse volume e cruzamento de dados pode 1) contribuir para melhorar a segurança e a solução de problemas, 2) reforçar a qualidade do serviço prestado ao cliente, por via do recurso à informação de call centers, garantindo a informação acerca de determinados padrões de consumo e optimizando os produtos segundo as necessidades do consumidor, 3) improvisar e aperfeiçoar produtos e serviços através do uso do conteúdo dos social media, 4) detectar fraudes em transacções online para qualquer indústria e 5) reforçar os pressupostos da avaliação do risco por via da análise da informação dos negócios nos mercados financeiros (Ularu et al., 2012).
A capacidade de dominar a tecnologia e o conhecimento de todos estes métodos de tratamento dos dados, bem como do seu potencial e as suas limitações, exigem capacidades específicas que são difíceis de encontrar hoje no mercado de trabalho. Torna-se premente que as empresas invistam em formação na área da Business Intelligence, que será necessariamente interdisciplinar e incorporará inevitavelmente o domínio das tecnologias da informação para enfrentar um universo dos negócios cada vez mais centrado nos dados. É claro que tudo isto obriga a uma adaptação dos funcionários das instituições a gerirem de forma mais eficaz o volume de dados que têm ao seu dispor e a incorporá-los em tomadas de decisão mais incisivas e fundamentadas. Com isto, e fruto disto, tende a emergir aquilo que alguns apelidam de algorithmists, com capacidades de domínio nas áreas da ciência da computação, matemática e estatística, assumindo funções de auditores no que toca à revisão/validação das previsões da Big Data.
Para além de especialistas em algoritmos, a outra designação para esta actividade é o de cientista de dados (data scientist). Num artigo de 2012, na Harvard Business Review, a profissão de cientista de dados foi deste modo caracterizada: “the sexiest job of the 21st century”. Esses profissionais são como que um híbrido de analistas, consultores e comunicadores de dados. Segundo De Mauro et al. (2015), o número destes técnicos/profissionais nas empresas é ainda residual face às necessidades emergentes: acredita-se que no ano de 2018 exista um potencial défice de 1,5 milhões de analistas de dados, e isto apenas nos Estados Unidos da América.
Nesse sentido, é significativo assinalar o investimento que está a ser feito pelo mercado no domínio da Big Data. Num artigo de Jocelyn Aspa, é citado um inquérito de 2015 da consultora Gartner que revela que 75% das 437 empresas participantes no estudo planeavam investir em Big Data (instrumentos e técnicas de análise). Lisa Kart, uma das directoras da Gartner, referia nesse relatório que se estava a verificar uma mudança de atitude por parte dos líderes das empresas, visto que procuravam estar menos concentrados no mero desenvolvimento de campanhas de publicidade e promoção e mais focados na procura de valor, por via da recolha e tratamento de todo um conjunto de dados capazes de optimizar novas soluções para os clientes em mercados cada vez mais competitivos, e onde sobreviverão os que estiverem na vanguarda das novas tendências.
No mesmo texto de Jocelyn Aspa é destacado um relatório da Research and Markets que estimou que os investimentos na área da Big Data seriam de aproximadamente 57 biliões de dólares em 2017, com a perspectiva de chegar aos 76 biliões no final do ano de 2020. Os números não ficam, contudo, por aqui: acredita-se que as receitas com a Big Data e demais ferramentas de análise associadas aos negócios possam crescer dos 122 biliões de dólares em 2015 para 187 biliões em 2019. Sem esquecer o papel de vanguarda que grandes empresas como a Google, Amazon e IBM estão a ter no investimento em Inteligência Artificial (hardware e software).
(continua)
Fontes consultadas
Aspa, J. (2018). Data Investment Facts. (URL: https://investingnews.com/daily/tech-investing/data-investing/data-investment-facts/). March 5th. Acesso: 25/08/2018.
Buyya, R. & Dastjerdi, A.V. (Eds.) (2016). Internet of Things: Principles and Paradigms. Massachusetts: Morgan Kaufmann Publishers.
De Mauro, A., Greco, M. & Grimaldi, M. (2015). What is big data? A consensual definition and a review of key research topics. API Conference Proceedings 1644, 97-104.
Ularu, E. G., Puican, F.C., Apostu, A. & Velicanu, M. (2012). Perspectives on Big Data and Big Data Analytics. Database Systems Journal, vol. III, nº 4.
Weiner, M. & Kochhar, S. (2016). Irreversible: The Public Relations Big Data Revolution. Institute for Public Relations. (URL: https://instituteforpr.org/wp-content/uploads/IPR_PR-Big-Data-Revolution_3-29.pdf)