-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathmyutils.py
executable file
·72 lines (55 loc) · 2.07 KB
/
myutils.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
"""
Diverses fonctions utiles communes à mes importers.
Ce module contient des fonctions utilitaires pour la manipulation de fichiers PDF,
la vérification de l'installation de pdfminer, et la traduction des abréviations de mois.
Functions:
is_pdfminer_installed(): Vérifie si pdftotext est installé.
pdf_to_text(filename: str): Convertit un fichier PDF en texte.
traduire_mois(mois: str): Traduit les abréviations de mois du français vers l'anglais.
"""
__copyright__ = "Copyright (C) 2019 Grostim"
__license__ = "GNU GPLv2"
import subprocess
from typing import Dict
def is_pdfminer_installed() -> bool:
"""
Vérifie si la commande pdftotext est disponible sur le système.
Returns:
bool: True si pdftotext est installé, False sinon.
"""
try:
result = subprocess.run(["pdftotext", "-v"], capture_output=True, text=True, check=False)
return result.returncode == 0
except FileNotFoundError:
return False
def pdf_to_text(filename: str) -> str:
"""
Convertit un fichier PDF en texte.
Args:
filename (str): Chemin du fichier à convertir
Returns:
str: Contenu textuel du fichier PDF.
Raises:
ValueError: Si la conversion échoue.
"""
try:
result = subprocess.run(["pdftotext", "-layout", filename, "-"],
capture_output=True, text=True, check=True)
return result.stdout
except subprocess.CalledProcessError as e:
raise ValueError(f"Erreur lors de la conversion du PDF : {e.stderr}")
TRADUCTIONS_MOIS = {
"fév": "feb", "mars": "mar", "avr": "apr", "mai": "may",
"juin": "jun", "juil": "jul", "août": "aug", "déc": "dec"
}
def traduire_mois(mois: str) -> str:
"""
Traduit les abréviations de mois du français vers l'anglais.
Args:
mois (str): Chaîne contenant des abréviations de mois en français.
Returns:
str: Chaîne avec les abréviations de mois traduites en anglais.
"""
for fr, en in TRADUCTIONS_MOIS.items():
mois = mois.replace(fr, en)
return mois