Include.Tools

Projet d’Automatisation de Rapports d’Analyses Bibliometriques:

Ce programme fait partie integrante du projet de conception et developpement d’outils automatises pour la realisation de rapports d’analyses bibliometriques.

Contexte:

Stage de 12 semaines sur l’ete 2023 (12 juin au 1er septembre) dans l’Ecole de Technologie Superieure, Montreal, Canada Mission principale:

Developper des outils permettant l’automatisation de certaines etapes de production de rapports d’analyses bibliometriques destines a aider les chercheurs et chercheuses dans la planification de la mesure de l’impact de leurs contributions scientifiques.

Approche choisie:

Nous avons choisi d’utiliser un script Python pour gerer toute l’automatisation des rapports.

Extraction des donnees: par les API des differentes plateformes utilisees (Scopus et SciVal) a l’aide de la bibliotheque publique “pybliometrics” Traitement des donnees: en Python a l’aide de la bibliotheque “pandas” Interface Homme-Machine: en QT avec une interface tres simpliste basee sur une boite de dialogue Exportation des donnees: en Python a l’aide de la bibliotheque “pywin32” vers un fichier “Workbook” MacroExcel (.xlsm) Mise en forme Excel: avec des routines VBA appelees par le script Python Realisation du rapport Word: avec des routines VBA, appelees par le script Python, qui exportent les donnees et les graphiques realises sur un document Word

Functions

Excel_autes_collabs(fileName, matches_df, ...)

Generer le rapport Excel de collaborations pour deux entites comparees.

Excel_collabs_ETS_pays(fileName, matches_df, ...)

Generer le rapport Excel de collaborations pour un pays donne.

Excel_part1(df, nom_prenom, en_tete, ...)

Renseigner le premier gabarit Excel avec les indicateurs de l'auteur.

Excel_part2(excel, classeur, df, df_SNIP, ...)

Ecrire les donnees SNIP et collaborations dans le classeur Excel deja ouvert.

add_affiliation_ids_to_list(df, ...)

Collecter les identifiants d'affiliation associes a chaque ligne de collaboration.

affRetrieval(choix, s, console)

Recuperer le profil Scopus de l'affiliation selectionnee.

collaborationExtract([researchersA, ...])

Extraire les collaborations entre deux groupes de chercheures ou d'institutions.

countAuthorsInCollab(df, keys)

Compter la frequence d'apparition de chaque auteur dans les collaborations.

countEntityAuthorsInCollab(df, ...)

Compter les auteurs associes a une entite donnee dans les collaborations.

countInstitutionsInCollab(df, collabCountry)

count_document_types(df)

Compter le nombre de publications par sous-type documentaire.

donnees_citations_graph_citations(...)

Recuperer les comptages de citations par annee pour les documents fournis.

donnees_documents_graph_citations(...)

Preparer les metadonnees necessaires a l'affichage du graphique des citations.

findCollabCountryAffiliations(...)

Recuperer les details d'affiliation pour les collaborations filtrees par pays.

findFuzzyMatches(df1, df2, console)

Construire un DataFrame listant les correspondances approximatives entre auteurs ETS et externes.

findOthersEtsAffiliations(non_matches_df, ...)

getAbstract(EID, keys)

Recuperer le resume associe a un document Scopus.

getAffiliation(InstitutionId, keys)

Recuperer le nom de l'institution associe a un identifiant Scopus.

getAffiliationCountry(InstitutionId, keys)

Recuperer le nom et le pays associes a une affiliation Scopus.

getAuthorORCID(authorId, keys)

Recuperer l'ORCID associe a un identifiant auteur Scopus.

getEntityProfile(selection, entity, keys, ...)

Recuperer le profil bibliometrique d'une entite donnee.

getSelectedYears(response)

Interpreter la reponse de l'utilisateur decrivant la periode d'analyse.

get_country_for_request(country_name)

get_country_in_english(country_name)

get_country_in_french(country_name)

highlight_fuzzy_matches(fileName, fuzzy_matches)

Mettre en surbrillance les lignes correspondant aux appariements approximatifs.

homonyme(resultatRecherche, console, ...)

Determiner la prochaine etape du processus de desambiguisation selon les resultats trouves.

load_ETS(console)

load_ETS_profs(console)

Charger la liste de reference des professeurs de l'ETS depuis le disque.

load_ORN(console)

load_UQ(console)

remove_accents(input_str)

retrieval(choix, s, console)

Recuperer le profil Scopus correspondant a l'auteur selectionne.

saveInter(fileName, dfAllResults[, ...])

Sauvegarder les jeux de donnees intermediaires dans un classeur Excel multi-feuilles.

saveResults(fileName, matches_df, ...)

Enregistrer l'analyse des collaborations dans un classeur Excel.

selection_2_types_docs(index_took, df, console)

Traiter la selection des deux types de documents a mettre en evidence.

selection_homonyme(choix, s, console)

Controler que l'indice choisi par l'utilisateur correspond a un auteur existant.

selection_plages_annees(annees_selec, years, ...)

Valider et interpreter les plages d'annees saisies par l'utilisateur.

selection_types_de_documents(selected_types, ...)

Verifier que les types de documents selectionnes existent reellement.

sort_by_first_list(*lists)

Fonction generique pour trier plusieurs listes selon l'ordre croissant de la premiere liste

tab_graph_Collab(author_id, years_list, ...)

Agreger les indicateurs de collaboration pour l'auteur etudie.

tab_graph_SNIP(author_id, years_list, ...)

Agreger les indicateurs SNIP associes aux productions de l'auteur.

tab_graph_citations(au_retrieval, eids_list, ...)

Construire les donnees et retours textuels necessaires au graphique de citations.

tab_graph_publications(au_retrieval, ...)

Construire les donnees necessaires pour tracer les publications par annee et par type.

tous_les_docs_chercheur(au_retrieval, console)

Construire un tableau recapitulatif des types de publications de l'auteur choisi.

tous_les_docs_entite(aff_retrieval)

Fonction qui retourne un DataFrame contenant toutes les collaborations d'une entite

update_entity_author_counts(...[, collabEntity])

valeurs_encadre(author_eid, years_list)

Calculer les indicateurs cles affiches dans l'encadre de synthese.

Include.Tools.Excel_autes_collabs(fileName, matches_df, other_ets_authors_df, other_authors_df, institutions_df, allResults_df, fuzzy_matches_df)[source]

Generer le rapport Excel de collaborations pour deux entites comparees.

Parameters:
  • fileName (str) – Nom du classeur de destination.

  • matches_df (pandas.DataFrame) – Auteurs apparies avec le personnel ETS.

  • other_ets_authors_df (pandas.DataFrame) – Auteurs ETS impliques dans la comparaison.

  • other_authors_df (pandas.DataFrame) – Auteurs externes detectes.

  • institutions_df (pandas.DataFrame) – Institutions impliquees.

  • allResults_df (pandas.DataFrame) – DataFrame consolidant toutes les collaborations.

  • fuzzy_matches_df (pandas.DataFrame) – DataFrame decrivant les appariements approximatifs.

Returns:

Tuple (excel_app, workbook) exposant les objets COM.

Return type:

tuple

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.Excel_collabs_ETS_pays(fileName, matches_df, other_ets_authors_df, other_authors_df, institutions_df, allResults_df, fuzzy_matches_df, country, debut, fin, date)[source]

Generer le rapport Excel de collaborations pour un pays donne.

Parameters:
  • fileName (str) – Nom du classeur de destination.

  • matches_df (pandas.DataFrame) – Auteurs apparies avec le personnel ETS.

  • other_ets_authors_df (pandas.DataFrame) – Auteurs ETS collaborant avec le pays cible.

  • other_authors_df (pandas.DataFrame) – Auteurs externes identifies.

  • institutions_df (pandas.DataFrame) – Institutions impliquees.

  • allResults_df (pandas.DataFrame) – DataFrame consolidant toutes les lignes de collaboration.

  • fuzzy_matches_df (pandas.DataFrame) – DataFrame decrivant les appariements approximatifs.

  • country (str) – Pays cible par l’analyse.

  • debut (str) – Annee de debut (telle que saisie dans l’interface).

  • fin (str) – Annee de fin (telle que saisie dans l’interface).

  • date (str) – Chaine de date a inserer dans le rapport.

Returns:

Tuple (excel_app, workbook) exposant les objets COM.

Return type:

tuple

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.Excel_part1(df, nom_prenom, en_tete, annee_10y_adapt)[source]

Renseigner le premier gabarit Excel avec les indicateurs de l’auteur.

Parameters:
  • df (pandas.DataFrame) – DataFrame contenant les metriques a exporter.

  • nom_prenom (list[str]) – Liste [nom, prenom] utilisee pour nommer les feuilles.

  • en_tete (list[str]) – Valeurs d’en-tete injectees dans le classeur.

  • annee_10y_adapt (int) – Premiere annee de la fenetre glissante de dix ans.

Returns:

Tuple (excel_app, workbook) exposant les objets COM.

Return type:

tuple

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.Excel_part2(excel, classeur, df, df_SNIP, df_Collab)[source]

Ecrire les donnees SNIP et collaborations dans le classeur Excel deja ouvert.

Parameters:
  • excel (Any) – Application Excel COM renvoyee par Excel_part1().

  • classeur (Any) – Classeur retourne par Excel_part1().

  • df (pandas.DataFrame) – DataFrame des publications ajoute au classeur.

  • df_SNIP (pandas.DataFrame) – DataFrame contenant les valeurs SNIP.

  • df_Collab (pandas.DataFrame) – DataFrame contenant les indicateurs de collaboration.

Returns:

None.

Return type:

None

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.add_affiliation_ids_to_list(df, affiliation_list, console)[source]

Collecter les identifiants d’affiliation associes a chaque ligne de collaboration.

Parameters:
  • df (pandas.DataFrame) – DataFrame issu de collaborationExtract().

  • affiliation_list (list[str]) – Liste recevant les identifiants collectes.

  • console (QPlainTextEdit) – Console utilisee pour indiquer la progression.

Returns:

None.

Return type:

None

Include.Tools.affRetrieval(choix, s, console)[source]

Recuperer le profil Scopus de l’affiliation selectionnee.

Parameters:
  • choix (int) – Index retenu par l’utilisateur.

  • s (AffiliationSearch) – Recherche d’affiliations Scopus.

  • console (QPlainTextEdit) – Console ou afficher le resume.

Returns:

Tuple avec l’EID (sans s2.0-) et l’instance AuthorRetrieval.

Return type:

tuple[str, AuthorRetrieval]

Include.Tools.collaborationExtract(researchersA=None, institutionsA=None, researchersB=None, institutionsB=None, country=None, start_year=None, end_year=None, keys=None, console=None)[source]

Extraire les collaborations entre deux groupes de chercheures ou d’institutions.

Parameters:
  • researchersA (list[str] | None) – Identifiants du premier groupe de chercheures.

  • institutionsA (list[str] | None) – Identifiants du premier groupe d’institutions.

  • researchersB (list[str] | None) – Identifiants du second groupe de chercheures.

  • institutionsB (list[str] | None) – Identifiants du second groupe d’institutions.

  • country (str | None) – Filtre pays applique aux collaborations.

  • start_year (int | None) – Annee de debut pour restreindre les resultats.

  • end_year (int | None) – Annee de fin pour restreindre les resultats.

  • keys (list[str] | None) – Cles API (cle + token) pour interroger Elsevier.

  • console (QPlainTextEdit | None) – Console utilisee pour afficher l’avancement.

Returns:

DataFrame contenant les collaborations trouvees.

Return type:

pandas.DataFrame

Include.Tools.countAuthorsInCollab(df, keys)[source]

Compter la frequence d’apparition de chaque auteur dans les collaborations.

Parameters:
  • df (pandas.DataFrame) – DataFrame de collaborations issu de collaborationExtract().

  • keys (list[str]) – Couple (cle, token) pour enrichir les resultats.

Returns:

Tuple de dictionnaires contenant effectifs, identifiants et affiliations.

Return type:

tuple[dict[str, int], dict[str, str], dict[str, str]]

Include.Tools.countEntityAuthorsInCollab(df, collabEntityList, keys)[source]

Compter les auteurs associes a une entite donnee dans les collaborations.

Parameters:
  • df (pandas.DataFrame) – DataFrame de collaborations issu de collaborationExtract().

  • collabEntityList (list[str]) – Liste des entites a suivre.

  • keys (list[str]) – Couple (cle, token) pour enrichir les resultats.

Returns:

Tuple de dictionnaires contenant effectifs, identifiants et affiliations.

Return type:

tuple[dict[str, int], dict[str, str], dict[str, str]]

Include.Tools.countInstitutionsInCollab(df, collabCountry)[source]
Include.Tools.count_document_types(df)[source]

Compter le nombre de publications par sous-type documentaire.

Parameters:

df (pandas.DataFrame) – DataFrame referencant les publications.

Returns:

Dictionnaire {sous-type: effectif}.

Return type:

dict[str, int]

Include.Tools.donnees_citations_graph_citations(au_retrieval, document_eids)[source]

Recuperer les comptages de citations par annee pour les documents fournis.

Parameters:
  • au_retrieval (AuthorRetrieval) – Instance AuthorRetrieval utilisee pour interroger Scopus.

  • document_eids (list[str]) – Identifiants des documents a analyser.

Returns:

DataFrame listant les citations par annee.

Return type:

pandas.DataFrame

Include.Tools.donnees_documents_graph_citations(au_retrieval, selected_types, df, console)[source]

Preparer les metadonnees necessaires a l’affichage du graphique des citations.

Parameters:
  • au_retrieval (AuthorRetrieval) – Instance AuthorRetrieval utilisee pour completer les donnees.

  • selected_types (list) – Liste des sous-types choisis.

  • df (pandas.DataFrame) – DataFrame decrivant les documents disponibles.

  • console (QPlainTextEdit) – Console pour afficher les retours intermediaires.

Returns:

Tuple contenant le DataFrame filtre et la liste des EID retenus.

Return type:

tuple[pandas.DataFrame, list[str]]

Include.Tools.findCollabCountryAffiliations(non_matches_df, all_collabs_df, collabCountry, keys)[source]

Recuperer les details d’affiliation pour les collaborations filtrees par pays.

Parameters:
  • non_matches_df (pandas.DataFrame) – Auteurs non apparies avec l’ETS.

  • all_collabs_df (pandas.DataFrame) – DataFrame complet des collaborations.

  • collabCountry (str) – Code pays applique au filtrage.

  • keys (list[str]) – Couple (cle, token) pour appeler les services Elsevier.

Returns:

DataFrame enrichi avec les informations d’affiliation et de pays.

Return type:

pandas.DataFrame

Include.Tools.findFuzzyMatches(df1, df2, console)[source]

Construire un DataFrame listant les correspondances approximatives entre auteurs ETS et externes.

Parameters:
  • df1 (pandas.DataFrame) – DataFrame de reference (souvent les auteurs ETS).

  • df2 (pandas.DataFrame) – DataFrame des participants aux collaborations.

  • console (QPlainTextEdit) – Console utilisee pour afficher la progression.

Returns:

DataFrame contenant les resultats de l’appariement.

Return type:

pandas.DataFrame

Include.Tools.findOthersEtsAffiliations(non_matches_df, all_collabs_df)[source]
Include.Tools.getAbstract(EID, keys)[source]

Recuperer le resume associe a un document Scopus.

Parameters:
  • EID (str) – Identifiant Scopus du document.

  • keys (list[str]) – Couple (cle, token) pour appeler les services Elsevier.

Returns:

Texte du resume ou "NONE" si absent.

Return type:

str

Include.Tools.getAffiliation(InstitutionId, keys)[source]

Recuperer le nom de l’institution associe a un identifiant Scopus.

Parameters:
  • InstitutionId (str) – Identifiant d’affiliation Scopus.

  • keys (list[str]) – Couple (cle, token) pour appeler les services Elsevier.

Returns:

Nom de l’institution ou "NONE" si introuvable.

Return type:

str

Include.Tools.getAffiliationCountry(InstitutionId, keys)[source]

Recuperer le nom et le pays associes a une affiliation Scopus.

Parameters:
  • InstitutionId (str) – Identifiant d’affiliation Scopus.

  • keys (list[str]) – Couple (cle, token) pour appeler les services Elsevier.

Returns:

Tuple (nom, pays) ou "NONE" si l’affiliation est introuvable.

Return type:

tuple[str, str] | str

Include.Tools.getAuthorORCID(authorId, keys)[source]

Recuperer l’ORCID associe a un identifiant auteur Scopus.

Parameters:
  • authorId (str) – Identifiant auteur Scopus.

  • keys (list[str]) – Couple (cle, token) pour appeler les services Elsevier.

Returns:

Chaine ORCID ou "NONE" si introuvable.

Return type:

str

Include.Tools.getEntityProfile(selection, entity, keys, rechercheParId)[source]

Recuperer le profil bibliometrique d’une entite donnee.

Parameters:
  • selection (str) – Type d’entite a interroger (auteur ou institution).

  • entity (str) – Identifiant ou texte de recherche de l’entite.

  • keys (list[str]) – Couple (cle, token) permettant d’appeler les services Elsevier.

  • rechercheParId (bool) – True si l’entite est fournie sous forme d’identifiant.

Returns:

Tuple contenant l’objet de recherche et l’objet de recuperation associes.

Return type:

tuple[AuthorSearch | AffiliationSearch, AuthorRetrieval | AffiliationRetrieval]

Include.Tools.getSelectedYears(response)[source]

Interpreter la reponse de l’utilisateur decrivant la periode d’analyse.

Parameters:

response (str) – Texte brut saisi via l’interface.

Returns:

Liste d’annees selectionnees, triees chronologiquement.

Return type:

list[int]

Include.Tools.get_country_for_request(country_name)[source]
Include.Tools.get_country_in_english(country_name)[source]
Include.Tools.get_country_in_french(country_name)[source]
Include.Tools.highlight_fuzzy_matches(fileName, fuzzy_matches)[source]

Mettre en surbrillance les lignes correspondant aux appariements approximatifs.

Parameters:
  • fileName (str) – Fichier Excel cible.

  • fuzzy_matches (pandas.DataFrame) – DataFrame listant les appariements.

Returns:

None.

Return type:

None

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.homonyme(resultatRecherche, console, window_width)[source]

Determiner la prochaine etape du processus de desambiguisation selon les resultats trouves.

Parameters:
  • resultatRecherche (AuthorSearch) – Resultat renvoye par la recherche d’auteurs Scopus.

  • console (QPlainTextEdit) – Console utilisee pour afficher les messages a l’utilisateur.

  • window_width (int) – Largeur (en caracteres) utilisee pour afficher les tableaux.

Returns:

0 si aucun profil n’est trouve, 1 si l’utilisateur doit choisir parmi plusieurs, 2 si un seul auteur correspond.

Return type:

int

Include.Tools.load_ETS(console)[source]
Include.Tools.load_ETS_profs(console)[source]

Charger la liste de reference des professeurs de l’ETS depuis le disque.

Parameters:

console (QPlainTextEdit) – Console utilisee pour afficher les messages d’etat.

Returns:

DataFrame contenant la liste des professeurs.

Return type:

pandas.DataFrame

Include.Tools.load_ORN(console)[source]
Include.Tools.load_UQ(console)[source]
Include.Tools.remove_accents(input_str)[source]
Include.Tools.retrieval(choix, s, console)[source]

Recuperer le profil Scopus correspondant a l’auteur selectionne.

Parameters:
  • choix (int) – Index retenu par l’utilisateur.

  • s (AuthorSearch) – Recherche Scopus contenant les resultats.

  • console (QPlainTextEdit) – Console ou afficher le resume.

Returns:

Tuple contenant l’EID (sans le prefixe s2.0-) et l’instance AuthorRetrieval.

Return type:

tuple[str, AuthorRetrieval]

Include.Tools.saveInter(fileName, dfAllResults, dfAuteurs=None, dfAuteursA=None, dfAuteursB=None, dfInstitutions=None)[source]

Sauvegarder les jeux de donnees intermediaires dans un classeur Excel multi-feuilles.

Parameters:
  • fileName (str) – Nom du classeur de destination.

  • dfAllResults (pandas.DataFrame) – DataFrame regroupant toutes les collaborations.

  • dfAuteurs (pandas.DataFrame | None) – DataFrame optionnel contenant la liste des auteurs.

  • dfAuteursA (pandas.DataFrame | None) – DataFrame optionnel des auteurs de l’entite A.

  • dfAuteursB (pandas.DataFrame | None) – DataFrame optionnel des auteurs de l’entite B.

  • dfInstitutions (pandas.DataFrame | None) – DataFrame optionnel listant les institutions.

Returns:

None.

Return type:

None

Include.Tools.saveResults(fileName, matches_df, other_ets_authors_df, other_authors_df, institutions_df, allResults_df)[source]

Enregistrer l’analyse des collaborations dans un classeur Excel.

Parameters:
  • fileName (str) – Nom de base du classeur exporte.

  • matches_df (pandas.DataFrame) – Auteurs apparies avec le personnel ETS.

  • other_ets_authors_df (pandas.DataFrame) – Auteurs ETS collaborant avec l’exterieur.

  • other_authors_df (pandas.DataFrame) – Auteurs externes identifies.

  • institutions_df (pandas.DataFrame) – Institutions impliquees.

  • allResults_df (pandas.DataFrame) – DataFrame consolide de toutes les lignes de collaboration.

Returns:

None.

Return type:

None

Raises:

RuntimeError – si la fonctionnalite est utilisee hors Windows.

Include.Tools.selection_2_types_docs(index_took, df, console)[source]

Traiter la selection des deux types de documents a mettre en evidence.

Parameters:
  • index_took (str) – Saisie utilisateur indiquant les indices choisis.

  • df (pandas.DataFrame) – DataFrame des types disponibles.

  • console (QPlainTextEdit) – Console pour guider l’utilisateur.

Returns:

Tuple (type_1, type_2) decrivant les sous-types retenus.

Return type:

tuple[str, str]

Include.Tools.selection_homonyme(choix, s, console)[source]

Controler que l’indice choisi par l’utilisateur correspond a un auteur existant.

Parameters:
  • choix (str) – Valeur entree par l’utilisateur.

  • s (AuthorSearch) – Objet Scopus contenant la liste des auteurs.

  • console (QPlainTextEdit) – Console utilisee pour afficher les messages.

Returns:

True si la selection est valide, False sinon.

Return type:

bool

Include.Tools.selection_plages_annees(annees_selec, years, selected_types, df, console)[source]

Valider et interpreter les plages d’annees saisies par l’utilisateur.

Parameters:
  • annees_selec (str) – Texte brut decrivant les plages d’annees.

  • years (list[int]) – Liste triee des annees disponibles.

  • selected_types (list) – Types de documents retenus, limitant les plages possibles.

  • df (pandas.DataFrame) – DataFrame des publications de l’auteur.

  • console (QPlainTextEdit) – Console ou afficher les instructions et erreurs.

Returns:

Liste de plages valides sous forme de tuples (debut, fin).

Return type:

list[tuple[int, int]]

Include.Tools.selection_types_de_documents(selected_types, len_df, console)[source]

Verifier que les types de documents selectionnes existent reellement.

Parameters:
  • selected_types (list) – Liste d’indices fournis par l’utilisateur.

  • len_df (int) – Nombre de lignes disponibles dans le DataFrame.

  • console (QPlainTextEdit) – Console utilisee pour afficher les erreurs.

Returns:

True si tous les indices sont valides, False sinon.

Return type:

bool

Include.Tools.sort_by_first_list(*lists)[source]

Fonction generique pour trier plusieurs listes selon l’ordre croissant de la premiere liste

Include.Tools.tab_graph_Collab(author_id, years_list, console, window_width)[source]

Agreger les indicateurs de collaboration pour l’auteur etudie.

Parameters:
  • author_id (str) – Identifiant Scopus de l’auteur.

  • years_list (list[int]) – Annees qui delimitent la fenetre d’analyse.

  • console (QPlainTextEdit) – Console utilisee pour afficher les retours textuels.

  • window_width (int) – Largeur en caracteres utilisee pour les tableaux.

Returns:

DataFrame contenant le nombre de collaborations par annee.

Return type:

pandas.DataFrame

Include.Tools.tab_graph_SNIP(author_id, years_list, console, window_width)[source]

Agreger les indicateurs SNIP associes aux productions de l’auteur.

Parameters:
  • author_id (str) – Identifiant Scopus de l’auteur.

  • years_list (list[int]) – Annees qui delimitent la fenetre d’analyse.

  • console (QPlainTextEdit) – Console utilisee pour afficher les retours textuels.

  • window_width (int) – Largeur en caracteres utilisee lors de l’affichage des tableaux.

Returns:

DataFrame contenant les valeurs SNIP par annee.

Return type:

pandas.DataFrame

Include.Tools.tab_graph_citations(au_retrieval, eids_list, liste_docs, console, window_width)[source]

Construire les donnees et retours textuels necessaires au graphique de citations.

Parameters:
  • au_retrieval (AuthorRetrieval) – Instance AuthorRetrieval utilisee pour recuperer les mesures.

  • eids_list (list[str]) – Liste des EID inclus dans le graphique.

  • liste_docs (list[str]) – Liste des titres affiches.

  • console (QPlainTextEdit) – Console pour afficher tableaux et syntheses.

  • window_width (int) – Largeur en caracteres utilisee pour les tableaux.

Returns:

Tuple avec le DataFrame de citations et la liste des annees etudiees.

Return type:

tuple[pandas.DataFrame, list[int]]

Include.Tools.tab_graph_publications(au_retrieval, document_eids, liste_annees, liste_type, console, window_width)[source]

Construire les donnees necessaires pour tracer les publications par annee et par type.

Parameters:
  • au_retrieval (AuthorRetrieval) – Instance AuthorRetrieval utilisee pour completer les metadonnees.

  • document_eids (list[str]) – Identifiants des documents a inclure.

  • liste_annees (list[int]) – Annees affichees sur le graphique.

  • liste_type (list[str]) – Types de documents suivis.

  • console (QPlainTextEdit) – Console pour afficher les retours textuels.

  • window_width (int) – Largeur en caracteres utilisee pour les tableaux.

Returns:

DataFrame indexe par annee et type contenant les effectifs.

Return type:

pandas.DataFrame

Include.Tools.tous_les_docs_chercheur(au_retrieval, console)[source]

Construire un tableau recapitulatif des types de publications de l’auteur choisi.

Parameters:
  • au_retrieval (AuthorRetrieval) – Instance obtenue via retrieval().

  • console (QPlainTextEdit) – Console utilisee pour presenter le recapitulatif.

Returns:

DataFrame contenant chaque type de document (traduit) et son effectif.

Return type:

pandas.DataFrame

Include.Tools.tous_les_docs_entite(aff_retrieval)[source]

Fonction qui retourne un DataFrame contenant toutes les collaborations d’une entite

Include.Tools.update_entity_author_counts(entityAuthor_counts, entityAuthor_IDs, entityAuthor_Aff, last_name, first_name, author, authorID, keys, collabEntity=None)[source]
Include.Tools.valeurs_encadre(author_eid, years_list)[source]

Calculer les indicateurs cles affiches dans l’encadre de synthese.

Parameters:
  • author_eid (str) – Identifiant Scopus de l’auteur.

  • years_list (list[int]) – Annees delimitant la fenetre d’analyse.

Returns:

Tuple contenant total de citations, h-index et nombre de publications.

Return type:

tuple[int, int, int]