FORUM D’ENTRAIDE INFORMATIQUE (FEI)
Site d’assistance et de sécurité informatique

Entraide pour le programmation en général (tous langages).
Règles du forum : Entraide concernant la programmation informatique en général, tous langages : recherche ou correction d'un code ou d'une fonction, aide à la réalisation d'un projet...
Pour la programmation web (HTML, CSS, PHP, MySQL...), il est conseillé de s'orienter dans le forum Webmastering.
Merci de lire et de respecter la charte générale du forum.
  • Avatar du membre
  • Avatar du membre
Avatar du membre
par lysa
#206725
Bonjour à tous,
Je suis actuellement sur un projet dans le domaine du Machine Learning, le but est de faire une classification supervisée sur un ensemble de données. Mes données sont un grand nombre de fichiers pdf , chaque fichier à une classe precise, le but est d'utiliser ces fichiers la comme jeu de données d'apprentissage afin de faire de la prediction de la classe sur de nouveaux fichiers.
Mon probléme c'est que je ne sais pas comment construire mon jeu de données d'entrainement vu que l'algrithme de classification doit s'entrainer sur le contenu de chaque fichier et dans mon data Frame d'entrainement j'ai la classe de chaque fichier et le nom du fichier en question. comment faire pour inclure le contenu de chaque fichier pdf dans mon Data Frame d'entrainement ?
Merci par avance pour vorte aide
Avatar du membre
par Kayotik
#209195
Vous renommer votre fichier PDF en .txt et vous copier/ Coller Le Contenu

Il vous faut Utiliser un logiciel de Unlock Fichier PDF=== Il faut arriver à forcer le renommer et l'extension PDF en .txt

Kayotik
Présentation

Hello, Bienvenue sur FEI :) @+ Gabriel.

Bonjour :bonjour: Merci de m'accueillir sur votr[…]

Bonjour à tous, D'abord, désol&eacut[…]

Salutations, chers amis, Les joueurs peuvent profi[…]