Page 1 sur 1

Parsing fichier

Posté : jeu. 24 juin 2021 21:05
par lysa
Bonjour à tous,
Je suis actuellement sur un projet dans le domaine du Machine Learning, le but est de faire une classification supervisée sur un ensemble de données. Mes données sont un grand nombre de fichiers pdf , chaque fichier à une classe precise, le but est d'utiliser ces fichiers la comme jeu de données d'apprentissage afin de faire de la prediction de la classe sur de nouveaux fichiers.
Mon probléme c'est que je ne sais pas comment construire mon jeu de données d'entrainement vu que l'algrithme de classification doit s'entrainer sur le contenu de chaque fichier et dans mon data Frame d'entrainement j'ai la classe de chaque fichier et le nom du fichier en question. comment faire pour inclure le contenu de chaque fichier pdf dans mon Data Frame d'entrainement ?
Merci par avance pour vorte aide

Re: Parsing fichier

Posté : dim. 8 mai 2022 19:43
par Kayotik
Vous renommer votre fichier PDF en .txt et vous copier/ Coller Le Contenu

Il vous faut Utiliser un logiciel de Unlock Fichier PDF=== Il faut arriver à forcer le renommer et l'extension PDF en .txt

Kayotik