Seminários Realizados


  Gerência de Grandes Volumes de Dados – Discutir os problemas introduzidos no tratamento de grandes volumes de dados. Identificar as principais técnicas para o armazenamento, representação e processamento de grandes volumes de dados.

Ementa:

Parte teórica

  • Introdução a Big Data

  • Estratégias de Armazenamento de Dados

  • Estratégias para o processamento de Grandes volumes de Dados

  • Ecossistema Hadoop, Hive, Spark

  • Ecossistema Hadoop- Hive, PigLatin

  • Hadoop e Bancos de Dados: HBase, QEF, Pg_pool, Postgre-SQL

  • Parte prática

  • Experiência com o Hadoop

  • Apresentadores: Fábio Porto (LNCC), Douglas Ericson Marcelino de Oliveira (ISTCC)

  • Tipo : Programa de Verão 2015 - LNCC Jornada em Ciência de Dados

  • Data : De 02/02/2015 à 05/02/2015

  • Apresentação para dowload - Parte I

  • Apresentação para dowload - Parte II

  • Apresentação para dowload - Parte III

  •   Pesquisa em Algoritmos e Aplicações em Mineração de Dados no contexto do CEFET/RJ – A Mineração de Dados (MD) é o processo de analisar coleções de objetos para detectar relacionamentos sistemáticos entre as propriedades desses objetos para gerar conhecimento que não é facilmente detectado. O processo de MD inclui quatro etapas gerais: seleção de dados, pré-processamento de dados, métodos e algoritmos de MD e análise de dados. A pesquisa em MD pode envolver cada uma destas etapas individualmente ou o processo como um todo. No contexto do CEFET/RJ, a pesquisa envolve o desenvolvimento de algoritmos e aplicações de MD que sejam voltados à solução de problemas práticos. Cada um dos temas investigados pode ser classificado em pesquisa básica ou aplicada. Os temas relacionados à pesquisa básica são aqueles que levam ao desenvolvimento de conhecimento e novas ferramentas que não têm aplicação imediata para os problemas reais. Os temas relacionados à pesquisa aplicada consistem em problemas reais de MD que usam as ferramentas desenvolvidas anteriormente para a sua solução. O foco da pesquisa está nos seguintes objetivos: (i) a obtenção de resultados científicos relevantes em MD, com destaque para a relação entre o arcabouço teórico e suas aplicações para resolver problemas práticos; (ii) o desenvolvimento de recursos humanos, por meio da participação de alunos de ensino médio, graduação e pós-graduação; (iii) a divulgação dos resultados da investigação por meio da organização de reuniões e eventos científicos relacionados à MD.

  • Apresentador: Eduardo Ogasawara – CEFET

  • Tipo : Seminário DEXL

  • Data : 11/08/2014

  • Apresentação para dowload

  •   $Upsilon$-DB: Managing Scientific Hypotheses as Uncertain and Probabilistic Data – In view of the paradigm shift that makes science ever more data-driven, we consider deterministic scientific hypotheses as uncertain data. This vision comprises a probabilistic database (p-DB) design methodology for the systematic construction and management of U-relational hypothesis DBs, viz., $Upsilon$-DBs. From a software point of view, $Upsilon$-DB is a probabilistic data system designed for scientists and engineers to manage and evaluate (rate/rank) data-intensive scientific hypotheses. We illustrate the potential of $Upsilon$-DB as a tool for deep predictive analytics.

  • Apresentador: Bernardo Gonçalves - Laboratório Nacional de Computação Científica - LNCC

  • Tipo : Seminário DEXL

  • Data : 02/06/2014

  • Resumo do seminário para dowload

  •   MongoDB, uma visão geral da ferramenta – Introdução sobre o MongoDB, uma base de dados NoSQL - ou como preferem os autores: de esquema dinâmico. Breve explicação sobre a fundamentação teórica, com um complemento sobre a parte prática de como montar uma infraestrutura escalável de fácil administração e acompanhamento com redundância, alta disponibilidade e segurança.

  • Apresentador: Pedro Guimarães - Laboratório Nacional de Computação Científica - LNCC

  • Tipo : Seminário DEXL

  • Data : 19/5/2014

  • Apresentação para dowload