Melhores práticas: Dados Na Web – #2 Forneça Metadados Descritivos!

Metadados são um recado de amor pro futuro

Ontem saiu o post sobre a Primeira Melhor Prática, que é Forneça Metadados. A segunda melhor prática do documento Melhores Práticas para Dados na Web, produzidas pelo WG DWBP, comento hoje.

BP2: Forneça metadados descritivos

Forneça metadados que descrevam as funcionalidades em geral dos datasets e distribuições.

Fornecer informação descritiva sobre os datasets permite que os user agents descubram automaticamente os datasets disponíveis na Web, além de permitir aos humanos entender a natureza do dataset e suas distribuições.

Resultado esperado

Fazendo isso os humanos serão capazes de interpretar a natureza dos dados no dataset e suas distribuições. Além disso os software agents vão descobrir automaticamente os datasets e suas distribuições.

Dados em uma publicação WEB

Possível Implementação

Metadados descritivos podem incluir as seguintes funcionalidades de um dataset:

  • O título e a descrição do dataset
  • Palavras-chave que descrevem o conteúdo
  • A data da publicação do dataset
  • A entidade responsável por tornar os dados disponíveis
  • O ponto de contato sobre o dataset
  • A cobertura geográfica do dataset
  • O período temporal que o dataset cobre
  • os temas ou categorias de um determinado dataset

Metadados descritivos podem incluir as seguintes funcionalidades de uma distribuição:

  • O título e a distribuição da distribuição
  • A data da publicação da distribuição
  • o tipo de mídia da distribuição

A versão legível por máquinas dos dados descritivos pode ser fornecida utilizando algum vocabulário recomendado pelo W3C, feito específicamente para descrever datasets. Por exemplo o Data Catalog Vocabulary. Ele fornece um framework para descrever no qual datasets podem ser descritos como entidades abstratas.

Veja o exemplo abaixo que traz dados legíveis por máquinas:

Ele mostra como utilizar o Data Catalog Vocabulary(DCAT) para fornecer dados que possam ser lidos por máquina para o dataset sobre paradas de ônibus (stops-2015-05-05). O dataset tem uma distribuição em .csv (stops-2015-05-05.csv) que também é descrita utilizando o >Data Catalog Vocabulary(DCAT).O dataset está classificado sobre o domínio representado pela URI relativa “mobilidade”.
Este domínio pode ser definido como parte de um set de domínios identificados pelos temas da URI. Para descrever ambos os conceitos e os conceitos do esquema, John utilizou o SKOS. Para expressar frequência de atualização, uma instância das “Content-Oriented Guidelines”, desenvolvidas como parte do vocabulário do W3C “Data Cube” foi utilizada. John escolher descrever a cobertura espacial e temporal do dataset usando URIs do Geonames e o Interval dataset, do data.gov.uk, respectivamente.

:stops-2015-05-05
a dcat:Dataset ;
dct:title "Bus stops of MyCity" ;
dcat:keyword "transport","mobility","bus" ;
dct:issued "2015-05-05"^^xsd:date ;
dcat:contactPoint <http://data.mycity.example.com/transport/contact> ;
dct:temporal <http://reference.data.gov.uk/id/year/2015> ;
dct:spatial <http://www.geonames.org/3399415> ;
dct:publisher :transport-agency-mycity ;
dct:accrualPeriodicity <http://purl.org/linked-data/sdmx/2009/code#freq-A> ;
dcat:theme :mobility ;
dcat:distribution :stops-2015-05-05.csv ;
.
:mobility
a skos:Concept ;
skos:inScheme :themes ;
skos:prefLabel "Mobility"@en ;
skos:prefLabel "Mobilidade"@pt
.
:themes
a skos:ConceptScheme ;
skos:prefLabel "A set of domains to classify documents" ;
.
:stops-2015-05-05.csv
a dcat:Distribution ;
dct:title "CSV distribution of stops-2015-05-05 dataset" ;
dct:description "CSV distribution of the bus stops dataset of MyCity" ;
dcat:mediaType "text/csv" ;
.

Aqui você pode também dar uma olhada em um exemplo de metadados descritivos direcionados ao entendimento de humanos.

Viu? A segunda melhor prática do documento também não é um bicho de sete cabeças. Na verdade, a prática do uso de metadados descritivo é promessa de ganho ao longo do tempo, uma vez que, quanto mais metadados, quanto mais ricos eles são e quanto mais padronizados, mais fácil de utilizá-los para fazer cruzamentos e leituras dos mesmos.

fonte

Escrever um comentário (0 Comentários)

Melhores práticas: Dados Na Web – #1 Forneça Metadados!

Metadata is a note love to the future

Com base no documento de Melhores Práticas para Dados na Web, produzidas pelo WG DWBP, vamos comentar uma Melhor Prática por dia.

Pois bem, hoje é dia da primeira:

BP1: Forneça Metadados

Os metadados podem ser considerados etiquetas que ajudam as máquinas e pessoas a identificar do que se trata e o que tem dentro dos datasets. Para entender porque eles são necessários, imagine um depósito do Wall Mart cheio de caixas empilhadas com produtos para vender. Agora, imagine que a Web é o interior da loja e você é o encarregado de colocar tudo nas prateleiras, organizando por tipo de produto. Pra otimizar o seu trabalho, os encarregados de empilhar as caixas no depósito deixaram tudo etiquetado, identificando o conteúdo de cada caixa, evitando que você tenha que abrir tudo para ver o que tem dentro antes de começar a arrumar. Pois bem, esses encarregados que etiquetaram tudo deixaram metadados pra você.

Assim fica fácil entender porque fornecer metadados quando colocar seus dados na Web é tão importante!

Forneça metadados para que humanos e aplicações de computador possam ler

Fornecer metadados é importante quando se publica dados na web porque publicadores de dados e consumidores de dados podem não se conhecer. Por causa disso é preciso prover informação que ajude humanos e computadores a entenderem os dados publicados, assim como outros importantes aspectos que podem ser descritos usando metadados.

Resultado esperado

Humanos poderão entender os metadados, assim como aplicações de computador – especialmente os user agents, serão capazes de processa-los.

Possível Implementação

Para dados que voê quer que humanos leiam, você pode fornecer metadados como parte de uma página HTML ou prover metadados em um arquivo-texto em separado.

Para dados legíveis por máquina, você pode utilizar um formato de serialização, tipo Turtle ou JSON ou pode embedar no html usando o HTML-RDFAou JSON-LDSe múltiplos formatos forem publicados separadamente, eles devem vir da mesma URL usando negociação de conteúdo (ou conneg) e ficar disponíveis em URIs diferentes, diferenciadas pela exptensão do nome do arquivo. A Manutenção de múltiplos formatos fica melhor se você puder gerar cada formato “on the fly” se baseando numa fonte única de metadados.

Além disso, quando você quiser tornar disponível dados sobre datasets para máquinas, é bom que você use padrões que já existem ou vocabulários que muitos outros publicadores já usam. Por exemplo, os termos do Dublin Core Metadata (DCMI), chamados de DCMI Metadata Terms e o Data Catalog Vocabulary

fonte
Escrever um comentário (0 Comentários)

Descomplique

Eduardo Alves de Carvalho

Analista Sênior de BI na e-Setorial

"Diante da descentralização e heterogeneidade dos Dados, o desafio é integrá-los, interpretá-los e transformá-los, de alguma forma, em Informação relevante ao seu negócio, possibilitando, com a devida análise, a criação de Conhecimento. Através da utilização e da gestão do conhecimento, nasce a Inteligência."


Nós, da e-Setorial, trabalhamos com integração e visualização de dados estratégicos, atuando com tecnologia de ponta, software livre e processos ágeis.
Criamos Solução de Apoio a Decisão para melhorar seus resultados, permitindo que atue embasado em fatos e tendências, não em suposições.


quero descomplicar a minha empresa


Escrever um comentário (0 Comentários)

33 sites que farão de você um gênio

Nada mais precioso do que saber o caminho do conhecimento

Não é nenhuma novidade que a web é, virtualmente, um poço infinito de informação e conhecimento. Pode-se dizer, sem correr o risco de dar um chute muito longe, que praticamente todo o conteúdo produzido pela humanidade está, de uma forma ou de outra, convertido em dados digitais, acessíveis a quem quiser.

O problema é saber quais caminhos percorrer para chegar até esse conhecimento. Afinal, também não é novidade alguma que o efeito de ter tanta informação acessível de forma tão rápida e gritante é, justamente, a dificuldade de se separar o joio do trigo.

E, se tem uma coisa que aprendi nessa vida como produtor de conteúdo, é o valor de se saber quais caminhos percorrer nessa busca.

E, posso dizer, com convicção, que saber quais são os melhores canais para achar conhecimento, nessa época tão repleta de ruído, é ouro.

Esse texto encontrei no Medium, escrita por Thomas Oppong. Aqui embaixo vai a lista dele que traduzimos na íntegra. Todos os links estão em inglês, mas alguns sites possuem legendas e/ou versões dos cursos em português, como o Coursera ou o TED. 

Acho que vale muito complementar com bons links brasileiros e/ou em português nos comentários. E aí, você começa?

33 sites que farão de você um gênio

A web cada vez mais se torna um recurso poderoso que pode facilmente nos ajudar a aprender algo novo todos os dias. E os sites fantásticos listados abaixo são tudo que você precisa.

“Não tenho nenhum talento especial, só tenho paixão em minha curiosidade.” – Albert Einstein

Há uma boa chance que você seja capaz de aplicar pelo menos uma dessas ferramentas de aprendizado e acabar se tornando uma pessoa melhor do que era ano passado. Estes são alguns dos melhores sites que o deixarão mais inteligente dia após dia.

1. BBC — Future— O deixa mais inteligente, todos os dias.

2. 99U (YouTube) —  Insights aplicáveis sobre produtividade, organização e liderança para ajudar as pessoas criativas a levarem suas ideias adiante.

3. Youtube EDU — Vídeos educacionais que não têm gatinhos bonitinhos entrando em caixas  —  mas que despertam conhecimento.

4. WikiWand — Uma interface nova e modernosa para a Wikipédia.

5. The long read (The Guardian) — Ensaios, perfis e reportagens que vão fundo.

6. TED — Ótimos vídeos para abrir sua mente para quase qualquer tópico.

7. iTunes U — Aprendizado “para viagem” das melhores universidades do mundo.

8. InsightfulQuestions (subreddit) — Discussões intelectuais que não são necessariamente ligadas a um ou outro gênero.

9. Cerego — Ajuda a confeccionar planos de estudo personalizados baseados em seus pontos fortes e fracos para ajudar a reter o conhecimento.

10. University of the People— Universidade online gratuita que oferece educação superior em vários canais.

11. OpenSesame — Mercado para treinamento online, com agora mais de 22 mil cursos.

12. CreativeLive — Faça aulas gratuitas sobre criatividade com os maiores especialistas do mundo.

13. Coursera— Em parceria com algumas das melhores universidades estadunidenses, o Coursera oferece uma imensidão de cursos gratuitos.

14. University of reddit — o produto do intelectualismo livre é um santuário para o compartilhamento do conhecimento.

15. Quora — Você pergunta, a internet discute – com grandes especialistas e fascinantes trocas sobre qualquer coisa.

16. Digital Photography School— Uma mina de ouro de artigos sobre como melhorar suas habilidades fotográficas.

17. Umano –Explore a maior coleção de artigos de áudio feitos por pessoas reais. O Dropox comprou a Umano. Brain Pickings é um ótimo substituto para o número 17.

17.1. Brain Pickings — Posts longos e profundos sobre vida, arte, ciência, design, história, filosofia e muito mais.

18. Peer 2 Peer University ou P2PU, é um projeto educacional aberto que o ajuda a aprender no seu próprio ritmo.

19. MIT Open CourseWare é um catálogo de cursos online e recursos de aprendizado oferecidos pelo MIT.

20. Gibbon— A playlist definitiva para o aprendizado.

21. Investopedia — Aprenda tudo que precisa saber sobre o mundo do investimento, mercados e finanças pessoais.

22. Udacity oferece aulas interativas online e cursos de educação superior.

23. Mozilla Developer Network oferece documentação detalhada e recursos de aprendizado para programadores web.

24. Future learn — aproveite cursos online gratuitos das melhores universidades e de organizações de especialistas.

25. Google Scholar  — fornece uma busca na literatura acadêmica, em todas suas disciplinas e fontes, incluindo teses, livros, resumos e artigos.

26. Brain Pump — Um lugar para aprender algo novo todos os dias.

27. Mental Floss — Teste seu conhecimento com fatos, trívias, testes e jogos que desafiam seu cérebro.

28. Learnist — Aprenda com uma curadoria da web, e de vídeos e livros, feita por especialistas.

29. DataCamp — Tutoriais online sobre ciência dos dados e R (pacote de softwares estatísticos).

30. edX — Faça cursos online nas melhores universidades do mundo.

31. Highbrow— Receba cursos condensados por e-mail.

32. Coursmos — Faça um microcurso quando quiser, em qualquer dispositivo.

33. Platzi— Aulas ao vivo sobre design, marketing e programação.

Quais das suas ferramentas de aprendizado favoritas não estão nessa lista?

“O que seria mais importante para alguém que quer aprender do que se tornar proficiente em pensar bem?” Peter Worle

fonte
Escrever um comentário (0 Comentários)

Cinco dicas poderosas para configurar o seu Web Analytics

Existem algumas dicas que você pode seguir para ajustar de forma precisa o seu Analytics para maximizar o valor desta ferramenta

As ferramentas de Analytics permitem coletar estatísticas de websites para responder questões fundamentais sobre a sua audiência e os seus interesses. Por exemplo, quem está visitando seu site? De onde eles vieram? O que eles estão fazendo no seu site?

Estas são informações bastante importantes, mas como você configura e utiliza estes dados?

Graças a experiência adquirida ao trabalhar com clientes de diversas indústrias, sabemos que ferramentas de Web Analytics são bastante eficientes para nos ajudar a responder estas questões. Existem algumas dicas que você pode seguir para ajustar de forma precisa o seu Analytics para maximizar (e muito) o valor desta ferramenta.

1. Mantenha seu Analytics limpo

Diversas áreas da sua performance digital podem ficar escondidas em um Analytics bagunçado, então vale a pena mantê-lo limpo. Sempre mantenha pelo menos uma visão limpa de todos os dados do seu website na sua conta do Analytics. Isso significa não ter filtros – só os dados como são coletados originalmente, com toda sua glória inalterada.

Porquê? Por que uma das características dos sistemas de Analytics é o de que, se você fizer uma mudança na visualização de seus dados, toda a mudança será aplicável apenas a partir daquele ponto, o que pode acabar causando perda de dados relevantes, caso você não seja cuidadoso.

2. Trackear e Taggear suas Fontes

As ferramentas de website Analytics automaticamente identificam os tipos diferentes de tráfego e suas fontes, mas o seu funcionamento perfeito depende da informação que a ferramenta consegue buscar das URLs que as pessoas estão utilizando para visualizar o seu site.

Então, munir as URLs do Analytics com mais informação, significa que você conseguirá ter um melhor e mais eficiente tracking. O próprio Google fornece uma ferramenta fácil de construção de URLs que faz com que adicionar informações às URLs seja um processo bem simples. Isto é feito através parâmetros UTM, que incluem informações sobre fontes de tráfego, tipos de campanha, nomes de campanha, etc... É importante ter certeza que a sua agência digital está utilizando URLs bem taggeadas. Mesmo quando utilizar links encurtados (bit.ly, por exemplo) as URLs originais devem incluir estes parâmetros UTM.

3. Definindo os Domínios e Subdomínios

Se o seu site tem múltiplos subdomínios, ativar a opção de mostrar o Domínio Completo na sua conta do Analytics fará a sua vida bem mais simples. O Google Analytics não faz isto de forma padrão, ele trata páginas com o mesmo nome em diferentes subdomínios como a mesma página.

Isto é bastante importante porque ele significaria que duas páginas, “exemplo.com/pagina1” e “subdomínio.com/pagina1” seriam exibidos como “/pagina1”no seu Analytics, dificultando sua análise. Você pode de resolver este ponto de maneira fácil, seguindo este passo-a-passo aqui. 

4. Mantenha tudo junto em um só lugar

Para conseguir os melhores resultados e análises com a informação que você tem sobre o seu site, você vai precisar combinar os dados do Google Analytics com outras fontes. O Google Analytics pode ser integrado facilmente com o Adwords e com o Google Search Console. Ao fazer essa integração, você consegue informações muito mais ricas sobre suas campanhas, atividades de search e performance de search pago.

Você talvez tenha que coordenar as agências com as quais você trabalha para implementar isto pela primeira vez, mas vale dizer que esta é uma atividade que só precisa ser realizada uma vez, e que vai te munir com dados valiosos sobre todas as suas atividades futuras. Você também pode ativar reports demográficos e por interesse no seu Analytics para conseguir mais informações sobre seus visitantes, e sobre quem eles são.

5. Use atalhos espertos

Nunca aconselharíamos cortar partes do trabalho em nenhuma atividade, mas existem alguns atalhos que você pode utilizar em Web Analytics. Uma vez que você identificou quais são os dados mais interessantes para você, é possível criar dashboards e atalhos que te levam diretamente para estes dados, fazendo com que a sua naegação seja mais fácil e rápida.

Dashboards são bons para representações visuais de dados (O Google Analytics tem um dashboard inicial com estatísticas chave do site que podem ser customizadas) mas se você faz download regulares de alguns dados, então recomendamos criar estes atalhos . Você terá que adicionar atalhos ao longo do tempo, mas é uma forma bastante prática de manter as coisas organizadas desde o início.

Estas dicas são algumas das coisas mais simples que encontramos, mas que farão toda a diferença ao utilizar o seu Analytics. Mas existem uma série de outras configurações que podem ser implementadas, melhorando e facilitando a sua vida com o Analytics de sua escolha. Como a maioria dos nossos clientes trabalha com o Google Analytics, focamos nossas recomendações nesta ferramenta, mas elas são facilmente aplicadas à outras ferramentas que você possa utilizar.

*Carol Lara é CSO da Mavens of London na América Latina

fonte
Escrever um comentário (0 Comentários)

Fuja da crise e amplie seus resultados

e-Setorial Business Analytics

"Sem dados, sem informação, sem conhecimento."


Amplie seus resultados!

Crie metas, monitore pela internet os indicadores e tome decisões inteligentes.

Automatize a integração de todos os dados relevantes em um grande armazém, projetado para permitir a extraçao e cruzamento de informações com extrema facilidade e confiabilidade.

Tenha uma solução sob medida, feita por consultores especializados e utilizando tecnologia de ponta sem desperdiçar um Real com licenças de uso.


Escrever um comentário (0 Comentários)