Curso Online de Mineração de Dados para Otimização de Resultados em Mecanismos de Buscas na Internet

Curso Online de Mineração de Dados para Otimização de Resultados em Mecanismos de Buscas na Internet

Apresentação final da dissertação de mestrado apresentado técnicas de mineração de dados, estratégias de recuperação de informação e uma ...

Continue lendo

Autor(a):

Carga horária: 2 horas


Por: R$ 23,00
(Pagamento único)

Certificado digital Com certificado digital incluído

Apresentação final da dissertação de mestrado apresentado técnicas de mineração de dados, estratégias de recuperação de informação e uma proposta de integração das duas para otimização de resultados.

Engenheiro Mecatrônico pela PUC-MG Especialista em Análise de Sistemas pela UFMG Mestre em Ciência da Computação pela UFMG Larga experiência em projetos de educação e tecnologia tanto na área governamental quanto na iniciativa privada.



  • Aqui você não precisa esperar o prazo de compensação do pagamento para começar a aprender. Inicie agora mesmo e pague depois.
  • O curso é todo feito pela Internet. Assim você pode acessar de qualquer lugar, 24 horas por dia, 7 dias por semana.
  • Se não gostar do curso você tem 7 dias para solicitar (através da pagina de contato) o cancelamento ou a devolução do valor investido.*
  • Adquira certificado ou apostila impressos e receba em casa. Os certificados são impressos em papel de gramatura diferente e com marca d'água.**
* Desde que tenha acessado a no máximo 50% do material.
** Material opcional, vendido separadamente.

Modelo de certificados (imagem ilustrativa):

Frente do certificado Frente
Verso do certificado Verso
  • otimização do ranking de documentos em máquinas de busca na web a partir da mineração de dados sensível a contextos

    joão guilherme rodrigues gallo

    orientador: prof. wagner meira jr., ph.d,

    28 de maio de 2009

    departamento de ciência da computação
    universidade federal de minas gerais

  • cenário

    máquinas de busca na web são das aplicações mais utilizadas atualmente.
    os usuários, em geral, não possuem muita experiência ou formação para utilizar esses recursos.
    por outro lado, esperam que sejam listadas as melhores respostas logo nas primeiras posições do ranking.
    entender o que o usuário espera como resposta do mecanismo de buscas sem que ele especifique adequadamente não é uma tarefa trivial.

  • motivação

    aumentar a quantidade de documentos relevantes aos usuários dos mecanismos de busca na web por meio da identificação do contexto semântico dos termos submetidos nas consultas da sessão de buscas corrente

  • premissas

    quantidade e heterogeneidade dos documentos indexados pelas máquinas de busca na web
    o mesmo termo pode ter significados semânticos distintos dependendo do contexto no qual se insere

    crescimento rápido e constante da quantidade de documentos indexados
    novos significados para os termos já indexados podem surgir a qualquer momento

  • premissas

    padrão comportamental dos usuários
    baixa qualidade das chaves de consulta
    refinamentos sucessivos das buscas

    modelos clássicos de recuperação da informação não se aproveitam das informações oriundas da interação com o usuário.
    as consultas são considerados eventos independentes

  • conceitos e técnicas aplicadas

    recuperação da informação
    modelo de espaços vetoriais
    set based vector model
    relevance feedback
    mineração de dados
    regras de associação
    mineração de dados sensível a contextos
    web data mining

  • recuperação da informação

    a ri trata da representação, armazenamento, organização e acesso à informação:
    a representação deve facilitar o modelamento de consultas pelo usuário
    o armazenamento deve permitir a maior economia de espaço possível
    a organização deve controlar o armazenamento a fim de otimizar o acesso
    o acesso deve ser simples e eficiente

  • recuperação da informação
    modelo esquemático

  • recuperação da informação
    limitações

    modelos clássicos consideram os documentos como “sacolas de termos”
    os documentos são considerados grupos de palavras não correlacionadas.
    considera-se a ocorrência de cada termo individualmente nos documentos

    pouca experiência do usuário pode dificultar a modelagem de consultas complexas

  • modelo de espaços vetoriais

    baseado na similaridade entre a consulta e os documentos da coleção

    seleção de documentos feita pela estimativa de relevância ao invés do casamento exato

    resultado: lista de documentos ordenados decrescentemente pela estimativa de relevância

  • modelo de espaços vetoriais

    modelagem da consulta e dos documentos por meio de vetores em um espaço euclidiano t-dimensional

    pesos calculados pela relação tf x idf (conceito de frequência no documento e raridade na coleção)
    tf(i,j) – ocorrências do termo i no documento j
    idf(i) – inverso do número de documentos da coleção com ocorrências do termo i


Matricule-se agora mesmo Preenchendo os campos abaixo
R$ 23,00
Pagamento único
Processando... Processando...aguarde...
Autorizo o recebimento de novidades e promoções no meu email.