Em alta, 'cientista de dados' é profissão de futuro

Mais do que conhecimento em estatística, matemática e TI, profissional reúne a habilidade de encontrar uma agulha no palheiro.

Uma adolescente vai ao supermercado e, ao passar no caixa, recebe um folheto informativo sobre gravidez. Ela ainda não sabe, mas, a partir da listagem de produtos comprados, foi identificada a probabilidade de gestação, confirmada semanas depois. Como chegaram ao resultado? Por meio do somatório de tecnologia, análise e, claro, o trabalho de um... cientista de dados.

Nos últimos meses, a carreira despontou como uma das mais promissoras em tecnologia da informação, especialmente com a explosão do Big Data, termo usado para descrever a grande quantidade de dados que precisa ser analisada para apoiar as tomadas de decisão. é considerada por analistas do mercado a profissão do futuro. A previsão de dobrar o volume de dados a cada dois anos e o salto de Hadoop [projetado para uso intensivo de dados] tem impulsionado a importância desse talento.

“Em meio a uma montanha de dados, o cientista de dados deve localizar padrões e identificar insights, fornecendo subsídios para que empresas identifiquem o melhor caminho para conduzir os negócios e conquistar diferencial competitivo”, explica Pedro Desouza, cientista de dados da EMC, que há 20 anos trabalha no segmento.

É como encontrar uma agulha no palheiro. “Cientista de dados é aquele que, normalmente, tem formação em Ciência da Computação, Matemática e Estatística com conhecimentos profundos nessas áreas. Mais do que isso, ele entende de negócios”, descreve Desouza. É ainda alguém curioso, que gosta de resolver problemas e não tem medo de errar e se comunicar.

Explicar a aplicação dos resultados matemáticos na linguagem dos negócios é vital nessa profissão. “Existem pessoas altamente técnicas que falham em não se preocupar com esse ponto. Aquele que adota essa postura, rapidamente, vai parar no terceiro subsolo do prédio”, brinca. Saber extrair informação de um banco de dados também faz parte da lista de um bom profissional da área.

Cientista de dados é diferente de um estatístico. “Um estatístico não manipula dados. Ele os recebe em um arquivo e não participa do caminho anterior. O cientista tem conhecimento fim a fim, desde a fonte até o produto final”, esclarece.

Escrever um comentário (0 Comentários)

Sentiment Analysis: a nova corrida do ouro da informação digital

Utilizando técnicas cada vez mais aprimoradas, essas tecnologias tentam “perceber” o que a multidão (milhares de pessoas) está pensando sobre um determinando tema ou fato.

Algumas das mais importantes organizações de mídia, como The Washington Post, Yahoo, Time e ABC News, estão investindo em tecnologias que podem resultar na construção de um túnel que levará à mina de ouro na camada profunda do tratamento da informação digital: extração do “sentimento” das multidões. Estes grupos investem em pesquisa tecnológica e apostam que vão descobrir o veio que garantirá a dianteira, e sobrevivência, nessa nova corrida do ouro da informação.

É uma área de exploração imensa, pois a interação de muitos indivíduos através das redes sociais conectadas gera enorme e variada quantidade de dados (texto, áudio, imagens estáticas, vídeo etc). Minerando os dados inseridos nas redes sociais, o “sentimento” das multidões pode ser detectado e torna-se uma das mais ricas fronteiras entre a computação e as ciências sociais.

Utilizando técnicas cada vez mais aprimoradas, essas tecnologias tentam “perceber” o que a multidão (milhares de pessoas) está pensando sobre um determinando tema ou fato.

Com o propósito de “captar o sentimento” no meio da conversação nas redes, sistemas que reconhecem linguagem (textmining) e tecnologias com inteligência artificial vasculham semanticamente os posts inseridos pelos usuários. São os computadores e softwares tentando entender o significado da linguagem humana contida nos bytes.

Para isso, utilizam máquinas computacionais que mastigam dados e mais dados (mining), rodando programas que analisam milhões de palavras contidas em mensagens nas redes sociais. Mas esses sistemas conseguem mesmo extrair “sentimentos” de uma massa de usuários de uma rede social conectada?

Exemplos

Um momento propício para observar essas tecnologias está acontecendo. Com o aquecimento da campanha eleitoral nos EUA, alguns sistemas tentam sinalizar o que a conversação nas redes sociais está dizendo de forma macro sobre os pré-candidatos à presidência. Entre eles estão: o Mentio Machine, do The Washington Post; The Signal, do Yahoo; Campaign Buzz Meter, da Time e rede de TV ABC.

Escrever um comentário (0 Comentários)

Big Data: nova fronteira para inovação e competitividade

O termo Big Data, utilizado para descrever grandes volumes de dados, ganha cada vez mais relevância à medida que a sociedade se depara com um aumento sem precedentes no número de informações geradas a cada dia. De acordo com a consultoria IDC, a quantidade de informação digital chegará a 2,7 zettabytes no mundo em 2012, um aumento de 48% em relação ao ano anterior.

A abordagem tradicional para Big Data se apoia na utilização de funcionalidades analíticas capazes de lidar com esse elevado volume de dados, ajudando as companhias a obter informações preciosas relacionadas à vantagem competitiva, diferenciação no relacionamento com o cliente e atuar no mercado com maior margem de acerto em suas decisões. Mas o desafio não se restringe apenas ao volume, mas na forma com a qual estas organizações se movimentam para lidar também com a variedade de formatos, a velocidade e a volatilidade dos dados.

Atualmente, cerca 15 petabytes de dados são gerados diariamente tanto em dados estruturadosàqueles provenientes de bancos de dados e sistemas de gestão empresarial, por exemplo – e os não estruturados, compostos por vídeos, comentários em redes sociais, conteúdo de blogs e dispositivos móveis. Atuar de forma estratégica em Big Data tem sido rotulado em adotar estratégias que avaliem, especialmente, os dados não estruturados e que estão fora do alcance dos sistemas convencionais de TI.

Para se ter uma ideia da complexidade dos dados não estruturados, imagine que um único segundo de vídeo em alta definição gera duas mil vezes mais bytes que uma página de texto. Desta forma, capturar, manusear e analisar este conteúdo se torna um grande desafio

Para gerenciar esse complexo cenário são necessários bancos de dados de elevada capacidade e um rápido manuseio e tratamento analítico destas informações, em alguns casos, em tempo real. O mercado de capitais e ações, por exemplo, atingiu a marca de mais de um milhão de transações por segundo e requer modelos de aplicações capazes de administrar, em tempo real, a distribuição de cargas de trabalho associadas a sofisticados algoritmos.

Escrever um comentário (0 Comentários)

Mídias sociais devem ser parte da estratégia, diz Gartner

Segundo instituto de pesquisas, companhias ainda não viram o valor desse posicionamento, que tem o poder de transformar negócios e garantir competitividade

Mais do que simplesmente permitir o acesso a sites como Facebook e Twitter ou mapear a marca nesses locais, mídias sociais devem ser parte da estratégia corporativa. “Pesquisas mostram que a adoção de ferramentas sociais no Brasil não estão no topo de prioridade dos CEOs ou CIOs. Isso tem de mudar, o poder dessas tecnologias é enorme para os negócios “, observa Cassio Dreyfuss, vice-presidente do Gartner.

Ele diz que não basta apenas adotar uma estratégia, mas que é preciso ir além e gerenciá-la, desenhando processos nos quais as ferramentas sociais serão protagonistas. "Estamos vendo um movimento interessante que as empresas começam a usar ferramentas sociais em nuvem privada para aprender a lidar e a se familiarizar com esse universo, e, depois, ampliam a presença nesse setor", relata.

De acordo com ele, esse universo ganha aditivo ao integrá-lo com Business Intelligence (BI) e plataformas de colaboração. Ele lembra, no entanto, que TI sempre tem de andar alinhada aos negócios. “TI é instrumento para aumentar competitividade e agregar valor.”

Redes sociais, mobilidade, cloud computing e gestão da informação são considerados pelo Gartner focos de atuação das empresas nos próximos meses, prática que o instituto de pesquisas batizou de Nexus. “Elas vão impactar e transformar os negócios”, sentencia Dreyfuss.

Escrever um comentário (0 Comentários)

Usando o replication master-slave no MySQL

Neste artigo, vou mostrar como criar uma replicação de servidores MySQL. Vale lembrar que replicação não é uma forma de backup, pois caso algo errado no banco de dados principal, o mesmo será clonado nos escravos.

Fiz tudo baseado no CentOS 6.0 e testado entre duas máquinas virtuais. Vamos partir do pressuposto de que o MySQL esteja instalado em ambas as máquinas. Lembre-se, também, de habilitar no firewall a comunicação entre os servidores.

Vamos assumir os seguintes fatos:

  • Master Server: 10.1.100.1;
  • Slave Server: 10.2.200.2;
  • MySQL Data path: /var/lib/mysql;
  • MySQL slave user named slave_user.

Agora, vamos editar no servidor master o arquivo /etc/my.cnf

# [mysqld] section
datadir = /var/lib/mysql
server-id = 1
relay-log = /var/lib/mysql/mysql-relay-bin
relay-log-index = /var/lib/mysql/var/mysql-relay-bin.index
log-error = /var/lib/mysql/mysql.err
master-info-file = /var/lib/mysql/mysql-master.info
relay-log-info-file = /var/lib/mysql/mysql-relay-log.info
log-bin = /var/lib/mysql/mysql-bin

Reinicie o servidor para que as modificações sejam carregadas:

$ sudo service mysqld restart
Escrever um comentário (0 Comentários)

Big Data cria grandes oportunidades para profissionais de TI

Cientistas e especialistas de dados Hadoop são muito procurados por empresas de Web e e-varejistas, serviços financeiros, energia, saúde, utilities e mídia.

Novas oportunidades de emprego estão surgindo para profissionais de TI na área do Big Data, termo usado para descrever grandes quantidades de dados que precisam ser analisadas em tempo real para conduzir a tomada de decisão e aumentar a lucratividade.

Um novo cargo - cientista de dados - é um bom exemplo. Ele normalmente tem formação em Ciência da Computação e Matemática, bem como as habilidades analíticas necessárias para encontrar a providencial agulha no palheiro de dados recolhidos pela empresa.

"Um cientista de dados é alguém que é curioso, que analisa os dados para detectar tendências", diz Anjul Bhambhri, vice-presidente de Produtos Big Data da IBM. "É quase como um indivíduo renascentista, que realmente quer aprender e trazer a mudança para uma organização."

Inédita há 18 meses, a carreira de "cientista de dados" explodiu em popularidade como termo de pesquisa Google. O número de buscas atingiu picos 20 vezes maiores do que o normal no último trimestre de 2011 e no primeiro trimestre de 2012. É o termo de busca mais popular entre os de alta tecnologia em cidades como São Francisco, Washington e Nova York.

Entre as empresas norte-americanas que procuram contratar cientistas de dados estão a PayPal, a Amazon e a HP. Na verdade, o termo "cientista de dados" é mencionado em 195 anúncios de emprego no site Dice.com.

Os departamentos de TI também estão procurando por desenvolvedores e administradores de sistemas que se especializam em ferramentas Hadoop, projetada para uso intensivo de dados e aplicações distribuídas e utilizadas por sites populares como o Yahoo, Facebook, LinkedIn e eBay.

Hadoop é mencionada na maior parte dos anúncios de empregos na Dice.com. Entre as empresas que buscam contratar engenheiros de software e desenvolvedores Hadoop estão AT&T Interactive, Sears, PayPal, AOL e Deloitte.

Hadoop "é uma habilidade emergente", diz Alice Hill, diretor da Dice.com. "As empresas precisam para gerenciar operações em grande escala, e toda a ideia do Hadoop é que você pode fazer isso com baixo custo. Isso funciona muito bem com o que estamos vendo em movimento para a nuvem."
Escrever um comentário (0 Comentários)

Mobilidade como chave para o crescimento

A massificação da mobilidade nas empresas se traduz em inúmeros benefícios para o negócio.

O uso da mobilidade no ambiente corporativo nunca esteve tão em alta. De acordo com uma recente pesquisa conduzida pela Check Point, a quantidade de dispositivos móveis conectados às redes corporativas dobrou entre 2009 e 2011. Tanto a maior variedade de smartphones e tablets quanto os esforços dos fabricantes para conquistarem o consumidor têm levado a uma redução nos preços desses dispositivos.

Apenas no último trimestre de 2011, foram 157,8 milhões de smartphones vendidos no mundo, número 54,7% maior que o registrado no mesmo período de 2010, segundo a consultoria IDC. A massificação da mobilidade nas empresas se traduz em inúmeros benefícios para o negócio. Um bom exemplo é o nível de integração e sofisticação alcançado entre as ferramentas de gestão e o ambiente móvel, fazendo com que as informações estejam disponíveis aos clientes cada vez mais em tempo real.

Todo o sistema de inteligência de negócios (Business Intelligence) pode ser gerenciado por meio de tablets e smartphones. Isso significa poder acessar uma informação complexa, como relatórios e painéis com indicadores, tudo em tempo real, exatamente no momento da tomada de decisão, algo que antes era possível nos PCs ou notebooks.

No atual estágio acirrado de competição entre as empresas para elevarem sua participação no mercado, esse pode ser o fator determinante entre o fechamento ou a perda de um contrato, o sucesso ou fracasso de um projeto, a aceleração do time-to-market ou a aplicação inadequada dos investimentos.

É inevitável que os gestores de TI apliquem cada vez mais tempo e recursos na integração de suas aplicações de negócios aos dispositivos móveis. A inovação nessa área será um divisor de águas entre os que querem realmente competir ou apenas ser “mais um” player, pois chega um determinado momento em que não é mais possível crescer sem inovar.

Escrever um comentário (0 Comentários)