Retour à la page d'accueil

Le projet TALC (Total Awareness in Libre Computing) essaie de répondre à plusieurs objectifs :

Sources d'information :

Collecter l'information
  Collecter des URL
    Problème des sites nécessitant des cookies, des plugins spéciaux, un login/pass, etc.
    Des URL récupérées automatiquement sur les flux habituels connus
    Des URL ajoutées manuellement 
  Trier avec unicité les URL collectées
  Collecter les documents associés aux URL
    Problème des documents inaccessibles (temporairement ou définitivement)
    Problème des sites nécessitant des cookies, des plugins spéciaux, un login/pass, etc.
  Collecter des documents transmis manuellement (par exemple non accessibles automatiquement
    ou non accessibles publiquement)
  Décider de conserver ou non les documents, par mots-clés

Classifier l'information
  Comptabiliser la présence de mots-clés différents	
  Critère fonction de la qualité de la source
  Critère fonction de l'intérêt des URL arrivantes et sortantes ?
  Critère fonction des mots-clés présents dans les URL arrivantes et sortantes ?
  Évaluation manuelle éventuelle par une ou plusieurs personnes
  Information publique ou à accès restreint
  Regrouper les informations identiques
    Sur une période donnée, et peut-être si mots-clés communs, analyser la proximité des
     documents 2 à 2, probablement mot à mot ou mots 2 par 2 (avec liste de mots inutiles)
  Convertir les documents en txt ou html si besoin, leur associer les infos type
  méta-données (auteur, date, etc.)
  
Faciliter l'accès à l'information triée
  Permettre la publication régulière d'une revue de presse
  Permettre l'accès par catégorie, la recherche dans les documents, etc.
  Probablement faciliter la communication avec Scrapbook

Problématiques annexes :
- administration des mots-clés et des mots inutiles
- administration des niveaux de qualité des différentes sources
- administration des critères de classification (poids éventuel, etc.)
- administration des niveaux de confidentialité

XHTML 1.0 valide CSS valide


Dernière mise à jour : 2005/11/03

Pour me contacter ou avoir des informations, envoyez-moi un message à bsibaud@april.org.