FORUM D’ENTRAIDE INFORMATIQUE (FEI)
Site d’assistance et de sécurité informatique

Entraide pour le programmation en général (tous langages).
Règles du forum : Entraide concernant la programmation informatique en général, tous langages : recherche ou correction d'un code ou d'une fonction, aide à la réalisation d'un projet...
Pour la programmation web (HTML, CSS, PHP, MySQL...), il est conseillé de s'orienter dans le forum Webmastering.
Merci de lire et de respecter la charte générale du forum.
  • Avatar du membre
Avatar du membre
par lysa
#206725
Bonjour à tous,
Je suis actuellement sur un projet dans le domaine du Machine Learning, le but est de faire une classification supervisée sur un ensemble de données. Mes données sont un grand nombre de fichiers pdf , chaque fichier à une classe precise, le but est d'utiliser ces fichiers la comme jeu de données d'apprentissage afin de faire de la prediction de la classe sur de nouveaux fichiers.
Mon probléme c'est que je ne sais pas comment construire mon jeu de données d'entrainement vu que l'algrithme de classification doit s'entrainer sur le contenu de chaque fichier et dans mon data Frame d'entrainement j'ai la classe de chaque fichier et le nom du fichier en question. comment faire pour inclure le contenu de chaque fichier pdf dans mon Data Frame d'entrainement ?
Merci par avance pour vorte aide

Bonjour L'optimisation des https://x-com-agency.n[…]

Désolé je n'avais pas compris . Voi[…]

Ok merci!

Bonjour 3gn Voilà le lien https://www.cjoin[…]