Cornelius : Différence entre versions
(→Cas particuliers) |
(→Filtres "Source de données") |
||
(2 révisions intermédiaires par le même utilisateur non affichées) | |||
Ligne 18 : | Ligne 18 : | ||
− | [[Fichier:wiki_cornelius_fonct_01.png]] | + | [[Fichier:wiki_cornelius_fonct_01.png|center|thumb]] |
Ligne 25 : | Ligne 25 : | ||
Le menu déroulant en haut à droite permet de modifier le critère de tri de la liste de résultats. Les critères de tri suivants sont disponibles : | Le menu déroulant en haut à droite permet de modifier le critère de tri de la liste de résultats. Les critères de tri suivants sont disponibles : | ||
− | * titre (A-Z, Z-A) | + | * '''titre''' (A-Z, Z-A) |
− | * date de publication (croissant, décroissant) | + | * '''date''' de publication (croissant, décroissant) |
− | * taux de similarité (croissant, décroissant) | + | * taux de '''similarité''' (croissant, décroissant) |
''Note concernant le taux de similarité'' | ''Note concernant le taux de similarité'' | ||
Ligne 45 : | Ligne 45 : | ||
Le premier filtre permet de sélectionner la source des signalements de départ, à partir desquels les comparaisons seront effectuées. | Le premier filtre permet de sélectionner la source des signalements de départ, à partir desquels les comparaisons seront effectuées. | ||
− | Le second filtre "Source des notices similaires" permet de sélectionner la source à prendre en compte pour les signalements à comparer. | + | Le second filtre '''"Source des notices similaires"''' permet de sélectionner la source à prendre en compte pour les signalements à comparer. |
Ainsi, si on sélectionne "HAL" comme source dans ces deux filtres, on affichera uniquement les doublons pour lesquels les 2 signalements proviennent de HAL. Des signalements provenant d'autres sources pourront toutefois être affichés si le nombre de signalements à valider est égal ou supérieur à 3. Un triplon HAL/HAL/PubMed sera par exemple affiché avec ce paramétrage. Un triplon HAL/PubMed/Crossref ne sera en revanche pas affiché. | Ainsi, si on sélectionne "HAL" comme source dans ces deux filtres, on affichera uniquement les doublons pour lesquels les 2 signalements proviennent de HAL. Des signalements provenant d'autres sources pourront toutefois être affichés si le nombre de signalements à valider est égal ou supérieur à 3. Un triplon HAL/HAL/PubMed sera par exemple affiché avec ce paramétrage. Un triplon HAL/PubMed/Crossref ne sera en revanche pas affiché. | ||
+ | |||
+ | '''/!\ L'ordre dans lequel les filtres sont appliqués importe.''' | ||
+ | |||
+ | Activer les deux filtres "Source de données" et "Source des notices similaires" consécutivement de façon inverse pour deux sources de données permet de se rendre compte que le choix de la source de départ détermine les résultats affichés, et donc la façon dont on va travailler. | ||
+ | |||
+ | Ainsi, choisir '''Crossref''' comme "Source de données" et '''HAL''' comme "Source des notices similaires" affichera une liste de résultats différente de celle générée en choisissant HAL comme "Source de données" et Crossref comme "Source des notices similaires". Dans le premier cas le point de départ est Crossref et l'élément de comparaison HAL, dans le second cas c'est l'inverse. | ||
+ | |||
+ | [[Fichier:wiki_cornelius_filtre_source_01.png|center|thumb]] | ||
+ | |||
+ | [[Fichier:wiki_cornelius_filtre_source_02.png|center|thumb]] | ||
+ | |||
+ | Si l'on souhaite procéder par '''type de document''', la comparaison HAL -> Crossref permettra de travailler plus finement. La typologie documentaire de HAL est en effet plus étendue que celle de Crossref, d'autant que cette dernière est pour l'instant limitée aux articles dans Cornelius. | ||
+ | |||
+ | En tout état de cause, pour traiter l’ensemble des doublons incertains hal/crossref, il est indispensable d’activer successivement les deux combinaisons de filtres. | ||
===== Filtres "Type de publication" ===== | ===== Filtres "Type de publication" ===== | ||
− | Ce filtre prend en compte les types de document Conditor utilisés pour comparer les signalements et non les types tels qu'ils sont présents dans les sources. | + | Ce filtre prend en compte les '''types de document Conditor''' utilisés pour comparer les signalements et non les types tels qu'ils sont présents dans les sources. |
− | Il s'agit des types suivants | + | Il s'agit des types suivants. |
− | * | + | * Article |
− | * | + | * Conférence |
− | * | + | * Thèse |
− | * | + | * Ouvrage |
− | * | + | * Chapitre |
− | * | + | * Rapport |
− | * | + | * Autre |
− | La case "Type de publication identique" permet de restreindre l'affichage aux signalements partageant le même type de document Conditor. | + | La case '''"Type de publication identique"''' permet de restreindre l'affichage aux signalements partageant le même type de document Conditor. |
===== Filtre "Date de publication"===== | ===== Filtre "Date de publication"===== | ||
Ligne 87 : | Ligne 101 : | ||
* Adresse affiliation auteur | * Adresse affiliation auteur | ||
− | Le texte saisi ne doit pas excéder 40 caractères. | + | Le texte saisi ne doit pas excéder '''40 caractères'''. |
Pour le filtre "Identifiant", il est recommandé de saisir le texte entre guillemets pour effectuer une recherche sur la chaîne de caractères précise. | Pour le filtre "Identifiant", il est recommandé de saisir le texte entre guillemets pour effectuer une recherche sur la chaîne de caractères précise. | ||
− | [[Fichier:wiki_cornelius_fonct_02.png]] | + | [[Fichier:wiki_cornelius_fonct_02.png|center|thumb]] |
=== Mode "validation" : comparer et valider les signalements proposés comme doublons === | === Mode "validation" : comparer et valider les signalements proposés comme doublons === | ||
Ligne 98 : | Ligne 112 : | ||
− | [[Fichier:wiki_cornelius_fonct_03.png]] | + | [[Fichier:wiki_cornelius_fonct_03.png|center|thumb]] |
Un cartouche en partie supérieure présente un résumé de chacun des signalements proposés à la validation, comportant les informations suivantes sous forme visuelle. | Un cartouche en partie supérieure présente un résumé de chacun des signalements proposés à la validation, comportant les informations suivantes sous forme visuelle. | ||
− | * | + | * Titre |
− | * | + | * Source de données |
− | * | + | * Type de publication |
− | * | + | * Année de publication |
− | * | + | * Auteur |
− | * | + | * Taux de similarité par rapport au signalement de départ (pour les signalements comparés seulement) |
− | * | + | * Identifiant Conditor |
Cela permet d'avoir une vue générale des informations principales, quel que soit le nombre de signalements comparés et pour tous ces signalements à la fois. | Cela permet d'avoir une vue générale des informations principales, quel que soit le nombre de signalements comparés et pour tous ces signalements à la fois. | ||
Ligne 120 : | Ligne 134 : | ||
L'ordre et la nature des champs affichés sont optimisés en fonction du type de publication, pour faciliter la prise de décision. | L'ordre et la nature des champs affichés sont optimisés en fonction du type de publication, pour faciliter la prise de décision. | ||
− | Certains champs sont cliquables : un lien hypertexte permet à partir de l'identifiant source (DOI, PMID, halID, PPN) d'afficher le signalement source. Dans le cas du DOI, le lien pointe vers la page sur le site de l'éditeur. | + | Certains champs sont cliquables : un lien hypertexte permet à partir de '''l'identifiant source''' (DOI, PMID, halID, PPN) d'afficher le signalement source. Dans le cas du DOI, le lien pointe vers la page sur le site de l'éditeur. |
− | Un lien est également présent au niveau de l'identifiant Conditor du signalement comparé. Il permet d'inverser l'ordre d'affichage et le sens de comparaison des signalements : le signalement comparé devient ainsi le signalement de base pour la comparaison. | + | Un lien est également présent au niveau de '''l'identifiant Conditor''' du signalement comparé. Il permet d'inverser l'ordre d'affichage et le sens de comparaison des signalements : le signalement comparé devient ainsi le signalement de base pour la comparaison. |
− | [[Fichier:wiki_cornelius_fonct_04.png]] | + | [[Fichier:wiki_cornelius_fonct_04.png|center|thumb]] |
Les boutons <Doublon> et <Non-doublon> permettent de valider le statut de doublon ou de non-doublon des 2 signalements en cours de comparaison. | Les boutons <Doublon> et <Non-doublon> permettent de valider le statut de doublon ou de non-doublon des 2 signalements en cours de comparaison. | ||
Ligne 140 : | Ligne 154 : | ||
− | [[Fichier:wiki_cornelius_fonct_05.png]] | + | [[Fichier:wiki_cornelius_fonct_05.png|center|thumb]] |
Il convient ensuite de cliquer sur <Enregistrer> pour enregistrer les décisions prises ou <Annuler> pour revenir à l'écran d'accueil. | Il convient ensuite de cliquer sur <Enregistrer> pour enregistrer les décisions prises ou <Annuler> pour revenir à l'écran d'accueil. | ||
Ligne 147 : | Ligne 161 : | ||
− | [[Fichier:wiki_cornelius_fonct_06.png]] | + | [[Fichier:wiki_cornelius_fonct_06.png|center|thumb]] |
=== Autres fonctionnalités === | === Autres fonctionnalités === | ||
− | Les actions effectuées lors d'une session peuvent être rappelées sous forme de notifications, en cliquant sur l'icône "clochette" en haut à droite de la barre de titre de | + | Les actions effectuées lors d'une session peuvent être rappelées sous forme de notifications, en cliquant sur l'icône "clochette" en haut à droite de la barre de titre de Cornélius. |
− | Le jeton d'authentification (token) peut être rappelé en cliquant sur l'icône "roue dentée" en haut à droite de la barre de titre de | + | Le jeton d'authentification (token) peut être rappelé en cliquant sur l'icône "roue dentée" en haut à droite de la barre de titre de Cornélius. |
− | [[Fichier:wiki_cornelius_fonct_07.png]] | + | [[Fichier:wiki_cornelius_fonct_07.png|center|thumb]] |
== Bonnes pratiques pour le travail collaboratif de validation == | == Bonnes pratiques pour le travail collaboratif de validation == | ||
− | Les bonnes pratiques définies ci-après visent à assurer l'homogénéité et la cohérence des décisions prises par l'ensemble des membres du réseau métier, et partant celles des données bibliographiques. | + | Les bonnes pratiques définies ci-après visent à assurer '''l'homogénéité et la cohérence''' des décisions prises par l'ensemble des membres du réseau métier, et partant celles des données bibliographiques. |
On s'efforce dans cette perspective de considérer des critères objectifs et univoques, reposant sur la seule analyse de la publication en tant qu'objet '''bibliographique''', sans tenir compte du contenu supposé des publications. | On s'efforce dans cette perspective de considérer des critères objectifs et univoques, reposant sur la seule analyse de la publication en tant qu'objet '''bibliographique''', sans tenir compte du contenu supposé des publications. | ||
Ligne 168 : | Ligne 182 : | ||
Dans les deux premiers cas, bien qu'il puisse potentiellement exister des similitudes de contenu, on est face à deux objets bibliographiques différents, à deux modalités différentes de publication scientifique. Dans ces deux cas, les signalements regroupés et comparés par Cornélius ne sont donc pas des doublons. | Dans les deux premiers cas, bien qu'il puisse potentiellement exister des similitudes de contenu, on est face à deux objets bibliographiques différents, à deux modalités différentes de publication scientifique. Dans ces deux cas, les signalements regroupés et comparés par Cornélius ne sont donc pas des doublons. | ||
− | Dans le troisième cas, c'est dans chacune des sources une vision différente du type de document pour un même objet bibliographique qui occasionne le regroupement et la comparaison des signalements par | + | Dans le troisième cas, c'est dans chacune des sources une vision différente du type de document pour un même objet bibliographique qui occasionne le regroupement et la comparaison des signalements par Cornélius. Dans ce cas, les signalements regroupés et comparés par Cornélius sont donc des doublons. |
− | |||
− | Dans ce cas, les signalements regroupés et comparés par Cornélius sont donc des doublons. | ||
=== Cas n° 1 : Les types de document diffèrent et les références de publication diffèrent -> on valide comme non doublon === | === Cas n° 1 : Les types de document diffèrent et les références de publication diffèrent -> on valide comme non doublon === | ||
Ligne 180 : | Ligne 192 : | ||
Ainsi, dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>. | Ainsi, dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>. | ||
− | [[Fichier:wiki_cornelius_pratiques_01.png]] | + | [[Fichier:wiki_cornelius_pratiques_01.png|center|thumb]] |
==== Exemple 2 : un article de revue et un acte de conférence ==== | ==== Exemple 2 : un article de revue et un acte de conférence ==== | ||
Ligne 186 : | Ligne 198 : | ||
Dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>. | Dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>. | ||
− | [[Fichier:wiki_cornelius_pratiques_02.png]] | + | [[Fichier:wiki_cornelius_pratiques_02.png|center|thumb]] |
=== Cas n° 2 non doublon : Le type de document est identique, mais les références de publication diffèrent -> on valide comme non doublon === | === Cas n° 2 non doublon : Le type de document est identique, mais les références de publication diffèrent -> on valide comme non doublon === | ||
Ligne 196 : | Ligne 208 : | ||
''Exemple à retrouver'' | ''Exemple à retrouver'' | ||
− | [[Fichier:wiki_cornelius_pratiques_03.png]] | + | [[Fichier:wiki_cornelius_pratiques_03.png|center|thumb]] |
==== Exemple 2 : un article avec des auteurs et un titre identiques, publié dans 2 revues différentes ==== | ==== Exemple 2 : un article avec des auteurs et un titre identiques, publié dans 2 revues différentes ==== | ||
− | [[Fichier:wiki_cornelius_pratiques_04.png]] | + | [[Fichier:wiki_cornelius_pratiques_04.png|center|thumb]] |
=== Cas n° 3 : Le type de document diffère, mais les références de publication sont identiques -> on valide comme doublon === | === Cas n° 3 : Le type de document diffère, mais les références de publication sont identiques -> on valide comme doublon === | ||
− | Dans certains cas, les sources attribuent un type de document différent à un même objet bibliographique. On peut citer notamment les séries de monographie : une même contribution parue dans les "Methods in Molecular Biology" est considérée comme un article de revue dans PubMed (voir [https://www.ncbi.nlm.nih.gov/pubmed/26235083| PMID 26235083]), comme un chapitre de livre sur le site de l'éditeur (voir sur SpringerLink : https://doi.org/10.1007/978-1-4939-2627-5_26) et dans HAL (voir [https://hal.archives-ouvertes.fr/hal-01406340| hal-01406340]). | + | Dans certains cas, les sources attribuent un type de document différent à un même objet bibliographique. On peut citer notamment les '''séries de monographie''' : une même contribution parue dans les "Methods in Molecular Biology" est considérée comme un article de revue dans PubMed (voir [https://www.ncbi.nlm.nih.gov/pubmed/26235083| PMID 26235083]), comme un chapitre de livre sur le site de l'éditeur (voir sur SpringerLink : https://doi.org/10.1007/978-1-4939-2627-5_26) et dans HAL (voir [https://hal.archives-ouvertes.fr/hal-01406340| hal-01406340]). |
Cette différence peut être plus mouvante et varier en fonction des contributions. Ainsi pour les "Lecture Notes in Computer Science", les contributions sont typées en chapitre de livre dans CrossRef, tantôt en article de revue, acte de conférence ou chapitre de livre dans HAL, enfin soit en chapitre soit en acte de conférence sur SpringerLink. Dans cette série sont en effet publiés à la fois de actes de conférence et des monographies non liées à des congrès. | Cette différence peut être plus mouvante et varier en fonction des contributions. Ainsi pour les "Lecture Notes in Computer Science", les contributions sont typées en chapitre de livre dans CrossRef, tantôt en article de revue, acte de conférence ou chapitre de livre dans HAL, enfin soit en chapitre soit en acte de conférence sur SpringerLink. Dans cette série sont en effet publiés à la fois de actes de conférence et des monographies non liées à des congrès. | ||
Ligne 210 : | Ligne 222 : | ||
Dans l'exemple suivant, on valide la comparaison effectuée par Cornélius comme <Doublon>. | Dans l'exemple suivant, on valide la comparaison effectuée par Cornélius comme <Doublon>. | ||
− | [[Fichier:wiki_cornelius_pratiques_05.png]] | + | [[Fichier:wiki_cornelius_pratiques_05.png|center|thumb]] |
== Cas particuliers == | == Cas particuliers == | ||
=== Que faire quand on ne peut pas prendre de décision en raison d'un manque d'informations? === | === Que faire quand on ne peut pas prendre de décision en raison d'un manque d'informations? === | ||
− | Pour certains dépôts dans HAL, la saisie est trop lacunaire et on ne dispose pas de suffisamment d'éléments pour prendre une décision. | + | Pour certains dépôts dans HAL, la saisie est trop lacunaire et on ne dispose pas de suffisamment d'éléments pour prendre une décision. Cornélius ne permet pas de mettre de côté certains cas ni de les marquer comme "indécidables". |
− | Il est alors prudent de valider comme <Non-doublon> pour supprimer la proposition de | + | Il est alors prudent de valider comme <Non-doublon> pour supprimer la proposition de Cornélius, et de corriger si applicable et possible le signalement source dans HAL. |
− | L'exemple suivant illustre en partie ce cas : si on s'en tient aux informations disponibles dans | + | L'exemple suivant illustre en partie ce cas : si on s'en tient aux informations disponibles dans Cornélius, la décision est difficile à prendre. En consultant le dépôt dans HAL (voir [https://hal.archives-ouvertes.fr/inserm-01470285| inserm-01470285]) et en ouvrant ouvre le fichier de texte intégral dans HAL, on constate qu'il s'agit bien d'un doublon. |
− | [[Fichier:wiki_cornelius_cas_particulier_01.png]] | + | [[Fichier:wiki_cornelius_cas_particulier_01.png|center|thumb]] |
− | === Que faire quand | + | === Que faire quand Cornélius propose des doublons multiples dans une même "grappe" ? === |
==== Exemple 1 : A n’est doublon de rien et B, C et D sont doublons ==== | ==== Exemple 1 : A n’est doublon de rien et B, C et D sont doublons ==== | ||
Ligne 229 : | Ligne 241 : | ||
Valider à <Non-doublon> pour A et B, A et C, A et D. | Valider à <Non-doublon> pour A et B, A et C, A et D. | ||
− | Si B, C et D sont des doublons incertains, on peut les afficher dans | + | Si B, C et D sont des doublons incertains, on peut les afficher dans Cornélius en cliquant sur l'identifiant Cornélius de l'un des 3. |
− | Si B, C et D sont des doublons certains, on ne peut pas les afficher dans | + | Si B, C et D sont des doublons certains, on ne peut pas les afficher dans Cornélius. |
Carte Trello en lien : [https://trello.com/c/TrUhZCoa/55-marquer-les-doublons-identifi%C3%A9s-comme-certains-dans-une-grappe-de-doublons-incertains| Marquer les doublons identifiés comme certains dans une grappe de doublons incertains] | Carte Trello en lien : [https://trello.com/c/TrUhZCoa/55-marquer-les-doublons-identifi%C3%A9s-comme-certains-dans-une-grappe-de-doublons-incertains| Marquer les doublons identifiés comme certains dans une grappe de doublons incertains] | ||
Ligne 239 : | Ligne 251 : | ||
Valider à <Doublon> A et B, à <Non-doublon> pour A et C, pour A et D | Valider à <Doublon> A et B, à <Non-doublon> pour A et C, pour A et D | ||
− | Si C et D sont considérés comme doublons incertains, | + | Si C et D sont considérés comme doublons incertains, Cornélius proposera de les valider. |
− | Si C et D sont des doublons certains, | + | Si C et D sont des doublons certains, Cornélius ne proposera pas de les valider il n'y aura donc pas besoin de validation. |
Version actuelle datée du 4 juin 2020 à 14:19
Sommaire
- 1 Cornélius : une interface pour valider les doublons incertains
- 2 Fonctionnalités
- 3 Bonnes pratiques pour le travail collaboratif de validation
- 3.1 Cas n° 1 : Les types de document diffèrent et les références de publication diffèrent -> on valide comme non doublon
- 3.2 Cas n° 2 non doublon : Le type de document est identique, mais les références de publication diffèrent -> on valide comme non doublon
- 3.3 Cas n° 3 : Le type de document diffère, mais les références de publication sont identiques -> on valide comme doublon
- 4 Cas particuliers
Cornélius : une interface pour valider les doublons incertains
Cornélius est l'interface web dédiée à la validation des doublons incertains de Conditor.
Elle est accessible à l'adresse : https://cornelius.conditor.fr. L'accès est conditionné par une authentification, contactez l'équipe Conditor pour obtenir un jeton d'authentification (token).
Pour en savoir plus concernant l'algorithme de similarité, consultez la page Algorithme de similarité pour le repérage de doublons incertains.
Pour en savoir plus concernant les évolutions en cours de Cornélius, consultez tableau de bord Trello.
Les fichiers source de l'application sont disponibles dans le dépôt Github du projet dans répertoire conditor-project/cornelius.
Fonctionnalités
Mode "liste" : afficher une liste de résultats
Par défaut, Cornélius affiche tous les doublons incertains repérés par la chaîne de traitement Conditor. Des tris et des filtres permettent d'affiner cet affichage.
Tri
Le menu déroulant en haut à droite permet de modifier le critère de tri de la liste de résultats. Les critères de tri suivants sont disponibles :
- titre (A-Z, Z-A)
- date de publication (croissant, décroissant)
- taux de similarité (croissant, décroissant)
Note concernant le taux de similarité
Pour chaque signalement, le taux de similarité avec le signalement de départ est affiché. Cela permet de sélectionner les cas ayant un taux de similarité élevé ou au contraire des signalements a priori dissemblables.
Filtres
Le menu de gauche rassemble les filtres qui permettent de cibler les cas à traiter et de définir précisément un corpus sur lequel travailler.
Lorsqu'un filtre est appliqué, la liste de résultats se met à jour automatiquement. Les compteurs de nombre de documents affichés à côté des filtres s'actualisent également.
Filtres "Source de données"
Le premier filtre permet de sélectionner la source des signalements de départ, à partir desquels les comparaisons seront effectuées.
Le second filtre "Source des notices similaires" permet de sélectionner la source à prendre en compte pour les signalements à comparer.
Ainsi, si on sélectionne "HAL" comme source dans ces deux filtres, on affichera uniquement les doublons pour lesquels les 2 signalements proviennent de HAL. Des signalements provenant d'autres sources pourront toutefois être affichés si le nombre de signalements à valider est égal ou supérieur à 3. Un triplon HAL/HAL/PubMed sera par exemple affiché avec ce paramétrage. Un triplon HAL/PubMed/Crossref ne sera en revanche pas affiché.
/!\ L'ordre dans lequel les filtres sont appliqués importe.
Activer les deux filtres "Source de données" et "Source des notices similaires" consécutivement de façon inverse pour deux sources de données permet de se rendre compte que le choix de la source de départ détermine les résultats affichés, et donc la façon dont on va travailler.
Ainsi, choisir Crossref comme "Source de données" et HAL comme "Source des notices similaires" affichera une liste de résultats différente de celle générée en choisissant HAL comme "Source de données" et Crossref comme "Source des notices similaires". Dans le premier cas le point de départ est Crossref et l'élément de comparaison HAL, dans le second cas c'est l'inverse.
Si l'on souhaite procéder par type de document, la comparaison HAL -> Crossref permettra de travailler plus finement. La typologie documentaire de HAL est en effet plus étendue que celle de Crossref, d'autant que cette dernière est pour l'instant limitée aux articles dans Cornelius.
En tout état de cause, pour traiter l’ensemble des doublons incertains hal/crossref, il est indispensable d’activer successivement les deux combinaisons de filtres.
Filtres "Type de publication"
Ce filtre prend en compte les types de document Conditor utilisés pour comparer les signalements et non les types tels qu'ils sont présents dans les sources.
Il s'agit des types suivants.
- Article
- Conférence
- Thèse
- Ouvrage
- Chapitre
- Rapport
- Autre
La case "Type de publication identique" permet de restreindre l'affichage aux signalements partageant le même type de document Conditor.
Filtre "Date de publication"
Le curseur permet de définir un intervalle de dates.
Filtres textuels
Les filtres suivants sont de type textuel et comportent un champ dans lequel saisir le texte à rechercher.
- Titre / Résumé
- Auteur
- Identifiant
- Adresse affiliation auteur
Le texte saisi ne doit pas excéder 40 caractères.
Pour le filtre "Identifiant", il est recommandé de saisir le texte entre guillemets pour effectuer une recherche sur la chaîne de caractères précise.
Mode "validation" : comparer et valider les signalements proposés comme doublons
Lorsqu'on clique sur le bandeau d'un signalement dans la liste de résultats, Cornélius bascule vers le mode "validation", affichant de façon complète les signalements comparés et permettant d'effectuer les validations.
Un cartouche en partie supérieure présente un résumé de chacun des signalements proposés à la validation, comportant les informations suivantes sous forme visuelle.
- Titre
- Source de données
- Type de publication
- Année de publication
- Auteur
- Taux de similarité par rapport au signalement de départ (pour les signalements comparés seulement)
- Identifiant Conditor
Cela permet d'avoir une vue générale des informations principales, quel que soit le nombre de signalements comparés et pour tous ces signalements à la fois.
La zone de comparaison/validation affiche le détail de 2 signalements en face à face.
Les champs affichés varient d'un cas à l'autre selon l'information présente.
Lorsque le contenu d'un champ diffère entre les 2 signalements, il est surligné. Lorsqu'il est strictement identique caractère à caractère, il n'est pas surligné.
L'ordre et la nature des champs affichés sont optimisés en fonction du type de publication, pour faciliter la prise de décision.
Certains champs sont cliquables : un lien hypertexte permet à partir de l'identifiant source (DOI, PMID, halID, PPN) d'afficher le signalement source. Dans le cas du DOI, le lien pointe vers la page sur le site de l'éditeur.
Un lien est également présent au niveau de l'identifiant Conditor du signalement comparé. Il permet d'inverser l'ordre d'affichage et le sens de comparaison des signalements : le signalement comparé devient ainsi le signalement de base pour la comparaison.
Les boutons <Doublon> et <Non-doublon> permettent de valider le statut de doublon ou de non-doublon des 2 signalements en cours de comparaison.
Un clic sur le bouton <Doublon> ou <Non-doublon> est nécessaire pour chacun des signalements comparés.
Par exemple, si Cornélius demande de valider 2 signalements B et C par rapport à un signalement de départ A, on procèdera comme suit.
- Cliquer sur <Doublon> ou <Non-doublon> pour prendre une décision concernant B par rapport à A
- L'information "doublon" ou "non-doublon" est alors affichée dans le cartouche de B
- Cliquer sur le cartouche de C pour le sélectionner et afficher le signalement complet
- Cliquer sur <Doublon> ou <Non-doublon> pour prendre une décision concernant C par rapport à A
- L'information "doublon" ou "non-doublon" est alors affichée dans le cartouche de C
Il convient ensuite de cliquer sur <Enregistrer> pour enregistrer les décisions prises ou <Annuler> pour revenir à l'écran d'accueil.
Après avoir cliqué <Enregistrer>, une fenêtre de confirmation s'affiche.
Autres fonctionnalités
Les actions effectuées lors d'une session peuvent être rappelées sous forme de notifications, en cliquant sur l'icône "clochette" en haut à droite de la barre de titre de Cornélius.
Le jeton d'authentification (token) peut être rappelé en cliquant sur l'icône "roue dentée" en haut à droite de la barre de titre de Cornélius.
Bonnes pratiques pour le travail collaboratif de validation
Les bonnes pratiques définies ci-après visent à assurer l'homogénéité et la cohérence des décisions prises par l'ensemble des membres du réseau métier, et partant celles des données bibliographiques.
On s'efforce dans cette perspective de considérer des critères objectifs et univoques, reposant sur la seule analyse de la publication en tant qu'objet bibliographique, sans tenir compte du contenu supposé des publications.
Voici quelques exemples de cas pour illustrer ce principe général.
Dans les deux premiers cas, bien qu'il puisse potentiellement exister des similitudes de contenu, on est face à deux objets bibliographiques différents, à deux modalités différentes de publication scientifique. Dans ces deux cas, les signalements regroupés et comparés par Cornélius ne sont donc pas des doublons.
Dans le troisième cas, c'est dans chacune des sources une vision différente du type de document pour un même objet bibliographique qui occasionne le regroupement et la comparaison des signalements par Cornélius. Dans ce cas, les signalements regroupés et comparés par Cornélius sont donc des doublons.
Cas n° 1 : Les types de document diffèrent et les références de publication diffèrent -> on valide comme non doublon
Exemple 1 : un preprint et un article
S'agissant des preprints et des articles, le point de vue rejoint celui développé dans page DOI des preprints du site "Question/réponse en IST" de l'INRA.
Ainsi, dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>.
Exemple 2 : un article de revue et un acte de conférence
Dans l'exemple suivant on valide la comparaison effectuée par Cornélius comme <Non-doublon>.
Cas n° 2 non doublon : Le type de document est identique, mais les références de publication diffèrent -> on valide comme non doublon
Exemple 1 : un article et sa correction
Dans l'exemple suivant, on peut constater dans Cornélius que les informations concernant le volume et la pagination diffèrent. On obtient ensuite l'information concernant le fait que l'article a été corrigé en consultant le signalement sur le site de l'éditeur Wiley, grâce au lien hypertexte présent sur le DOI dans Cornélius. On valide la comparaison effectuée par Cornélius comme <Non-doublon>.
Exemple à retrouver
Exemple 2 : un article avec des auteurs et un titre identiques, publié dans 2 revues différentes
Cas n° 3 : Le type de document diffère, mais les références de publication sont identiques -> on valide comme doublon
Dans certains cas, les sources attribuent un type de document différent à un même objet bibliographique. On peut citer notamment les séries de monographie : une même contribution parue dans les "Methods in Molecular Biology" est considérée comme un article de revue dans PubMed (voir PMID 26235083), comme un chapitre de livre sur le site de l'éditeur (voir sur SpringerLink : https://doi.org/10.1007/978-1-4939-2627-5_26) et dans HAL (voir hal-01406340).
Cette différence peut être plus mouvante et varier en fonction des contributions. Ainsi pour les "Lecture Notes in Computer Science", les contributions sont typées en chapitre de livre dans CrossRef, tantôt en article de revue, acte de conférence ou chapitre de livre dans HAL, enfin soit en chapitre soit en acte de conférence sur SpringerLink. Dans cette série sont en effet publiés à la fois de actes de conférence et des monographies non liées à des congrès.
Dans l'exemple suivant, on valide la comparaison effectuée par Cornélius comme <Doublon>.
Cas particuliers
Que faire quand on ne peut pas prendre de décision en raison d'un manque d'informations?
Pour certains dépôts dans HAL, la saisie est trop lacunaire et on ne dispose pas de suffisamment d'éléments pour prendre une décision. Cornélius ne permet pas de mettre de côté certains cas ni de les marquer comme "indécidables".
Il est alors prudent de valider comme <Non-doublon> pour supprimer la proposition de Cornélius, et de corriger si applicable et possible le signalement source dans HAL.
L'exemple suivant illustre en partie ce cas : si on s'en tient aux informations disponibles dans Cornélius, la décision est difficile à prendre. En consultant le dépôt dans HAL (voir inserm-01470285) et en ouvrant ouvre le fichier de texte intégral dans HAL, on constate qu'il s'agit bien d'un doublon.
Que faire quand Cornélius propose des doublons multiples dans une même "grappe" ?
Exemple 1 : A n’est doublon de rien et B, C et D sont doublons
Valider à <Non-doublon> pour A et B, A et C, A et D.
Si B, C et D sont des doublons incertains, on peut les afficher dans Cornélius en cliquant sur l'identifiant Cornélius de l'un des 3.
Si B, C et D sont des doublons certains, on ne peut pas les afficher dans Cornélius.
Carte Trello en lien : Marquer les doublons identifiés comme certains dans une grappe de doublons incertains
Exemple 2 : A et B sont doublons, C et D sont doublons
Valider à <Doublon> A et B, à <Non-doublon> pour A et C, pour A et D
Si C et D sont considérés comme doublons incertains, Cornélius proposera de les valider.
Si C et D sont des doublons certains, Cornélius ne proposera pas de les valider il n'y aura donc pas besoin de validation.