Excel et les gènes sont fâchés

Proposé par
le

Pour les généticiens du monde entier, Excel est un vrai cauchemar. Le logiciel est à l'origine d'un nombre important d'erreurs, car il convertit les noms de certains gènes, comme "MARCH1" en dates (1-Mar). Environ une publication scientifique sur 5 en fait les frais, et la solution la plus simple a donc consisté à renommer des dizaines de gènes.


Commentaires préférés (3)

Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.

a écrit : Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft.

a écrit : J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je
trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft. Afficher tout
Ce n'est pas du tout une question de niveau d'éducation, loin de là. Allez faire un tour du coté de l'open-data, vous constaterez que presque tous les jeux de données sont au format Excel. Et figurez-vous que c'est la même chose du coté des données non-ouvertes. S'il y a des macros, ou autres fonctionnalités avancées, la compatibilité avec d'autres logiciels n'est pas garantie. La plupart des données dont généralement inscrites dans une base de données unifiée pour les travaux, mais s'il y des erreurs (de saisie ou d’interprétation d'Excel), elle se retrouveront aussi en base. D'autant que la plupart du temps, ce sont des moulinettes automatiques qui s'en chargent. Quand on doit agréger des milliers (voire bien plus) de jeux de données en un seul, ce n'est pas possible de vérifier tous les fichiers manuellement ...
Ensuite, il faut bien comprendre que produire de la donnée et l'analyser ce n'est pas du la même chose, et c'est réalisé par des profils très différents. Les producteurs de données sont assez rarement scientifiques d'ailleurs : infirmiers, sociologues, administrations, transporteurs, etc. Et quand t'es scientifique, ben tu bosses avec les données que tu as, et tu as rarement le luxe (temps et/ou financement) de tout vérifier et modifier manuellement. Sans compter que le rendu de tes résultats est presque toujours imposé comme étant compatible avec Excel pour publication, relecture, réutilisation, etc. parce que c'est effectivement bien plus partageable qu'un dump de base de données.
Et donc quand Excel t'es imposé à la majorité des étapes de tes travaux, il ne « suffit » pas d'utiliser autre chose, merci d'éviter ce genre de condescendance.


Tous les commentaires (74)

Est-ce impossible de supprimer la conversion implicite et de la faire uniquement lorsque cela est désiré ?

Posté le

android

(5)

Répondre

Idem pour des nombres écrit en hexa !
Par exemple la valeur hexa 1E001 sera considéré comme étant égale à 10 au lieu de 122881

Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.

a écrit : Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft.

a écrit : Est-ce impossible de supprimer la conversion implicite et de la faire uniquement lorsque cela est désiré ? Oui, il suffit de modifier le format de cellule je crois (valeur monétaire, date, standart, texte et...) On peut même personnaliser ce format pour qu’ils correspondent exactement à nos besoins

a écrit : J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je
trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft. Afficher tout
La première source précise que dans certain cas, même en modifiant le format de la cellule, le problème persistait et qu'il n'y avait aucune solution...

Posté le

android

(22)

Répondre

a écrit : La première source précise que dans certain cas, même en modifiant le format de la cellule, le problème persistait et qu'il n'y avait aucune solution... Voilà comment résoudre tous les problèmes indiqués dans la première source : www.google.fr/search?q=alternative+Excel

Quelqu’un qui se plaint qu’il n’arrive pas à faire sa compta correctement avec Paint, je lui répondrai qu’il est débile et qu’il doit utiliser autre chose. Là c’est pareil.
Excel ça reste un logiciel généraliste. Il permets de faire plein de choses, mais moyennement bien. Dans beaucoup de situations ça suffit, mais dès fois non. Dans ce cas il faut trouver autre chose de plus spécifique.
Comme je l’ai indiqué, les alternatives à Excel c’est pas ce qui manque. Il y en a littéralement des centaines.

a écrit : Voilà comment résoudre tous les problèmes indiqués dans la première source : www.google.fr/search?q=alternative+Excel

Quelqu’un qui se plaint qu’il n’arrive pas à faire sa compta correctement avec Paint, je lui répondrai qu’il est débile et qu’il doit utiliser autre chose. Là c’est pareil.
Ex
cel ça reste un logiciel généraliste. Il permets de faire plein de choses, mais moyennement bien. Dans beaucoup de situations ça suffit, mais dès fois non. Dans ce cas il faut trouver autre chose de plus spécifique.
Comme je l’ai indiqué, les alternatives à Excel c’est pas ce qui manque. Il y en a littéralement des centaines.
Afficher tout
Et encore Excel est bien plus puissant qu’on ne croit quand on s’en sert bien.
Mais plus je travaille et plus je me rend compte que le besoin en formation informatique est un secteur d’avenir ;)

a écrit : La première source précise que dans certain cas, même en modifiant le format de la cellule, le problème persistait et qu'il n'y avait aucune solution... La solution pour qu’Excel ne modifie pas une saisie et cela malgré le format ( j’en ai eu plusieurs fois là malheureuse expérience) est de mettre un ‘ (apostrophe) avant le texte ou le nombre.
Par contre, aucune idée de comment sont traitées les saisies dans ce cas précis...donc ça ne doit probablement pas marcher pour cette application.
Par exemple, quand je tapais 0012344 pour une référence précise, Excel m’ôtais systématiquement les deux premiers zéro alors qu’il me les fallait absolument.
Peu importe le format choisi, ça ne changeait rien.
Avec l’apostrophe, problème résolu si je filtre, mes deux zéros apparaissent et sans l’apostrophe,!

a écrit : J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je
trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft. Afficher tout
Ce n'est pas du tout une question de niveau d'éducation, loin de là. Allez faire un tour du coté de l'open-data, vous constaterez que presque tous les jeux de données sont au format Excel. Et figurez-vous que c'est la même chose du coté des données non-ouvertes. S'il y a des macros, ou autres fonctionnalités avancées, la compatibilité avec d'autres logiciels n'est pas garantie. La plupart des données dont généralement inscrites dans une base de données unifiée pour les travaux, mais s'il y des erreurs (de saisie ou d’interprétation d'Excel), elle se retrouveront aussi en base. D'autant que la plupart du temps, ce sont des moulinettes automatiques qui s'en chargent. Quand on doit agréger des milliers (voire bien plus) de jeux de données en un seul, ce n'est pas possible de vérifier tous les fichiers manuellement ...
Ensuite, il faut bien comprendre que produire de la donnée et l'analyser ce n'est pas du la même chose, et c'est réalisé par des profils très différents. Les producteurs de données sont assez rarement scientifiques d'ailleurs : infirmiers, sociologues, administrations, transporteurs, etc. Et quand t'es scientifique, ben tu bosses avec les données que tu as, et tu as rarement le luxe (temps et/ou financement) de tout vérifier et modifier manuellement. Sans compter que le rendu de tes résultats est presque toujours imposé comme étant compatible avec Excel pour publication, relecture, réutilisation, etc. parce que c'est effectivement bien plus partageable qu'un dump de base de données.
Et donc quand Excel t'es imposé à la majorité des étapes de tes travaux, il ne « suffit » pas d'utiliser autre chose, merci d'éviter ce genre de condescendance.

a écrit : Voilà comment résoudre tous les problèmes indiqués dans la première source : www.google.fr/search?q=alternative+Excel

Quelqu’un qui se plaint qu’il n’arrive pas à faire sa compta correctement avec Paint, je lui répondrai qu’il est débile et qu’il doit utiliser autre chose. Là c’est pareil.
Ex
cel ça reste un logiciel généraliste. Il permets de faire plein de choses, mais moyennement bien. Dans beaucoup de situations ça suffit, mais dès fois non. Dans ce cas il faut trouver autre chose de plus spécifique.
Comme je l’ai indiqué, les alternatives à Excel c’est pas ce qui manque. Il y en a littéralement des centaines.
Afficher tout
Oui clairement, surtout que pour du traitement de données longues/lourdes/nombreuses Excel est vite a genoux...
Excel est polyvalent, adaptable a de nombreux cas d'utilisation etc... Mais je te rejoins à 100%, d'autant plus qu'on peut se former a Python sans trop de difficulté via internet.

Posté le

android

(0)

Répondre

a écrit : Ce n'est pas du tout une question de niveau d'éducation, loin de là. Allez faire un tour du coté de l'open-data, vous constaterez que presque tous les jeux de données sont au format Excel. Et figurez-vous que c'est la même chose du coté des données non-ouvertes. S'il y a des macros, ou autres fonctionnalités avancées, la compatibilité avec d'autres logiciels n'est pas garantie. La plupart des données dont généralement inscrites dans une base de données unifiée pour les travaux, mais s'il y des erreurs (de saisie ou d’interprétation d'Excel), elle se retrouveront aussi en base. D'autant que la plupart du temps, ce sont des moulinettes automatiques qui s'en chargent. Quand on doit agréger des milliers (voire bien plus) de jeux de données en un seul, ce n'est pas possible de vérifier tous les fichiers manuellement ...
Ensuite, il faut bien comprendre que produire de la donnée et l'analyser ce n'est pas du la même chose, et c'est réalisé par des profils très différents. Les producteurs de données sont assez rarement scientifiques d'ailleurs : infirmiers, sociologues, administrations, transporteurs, etc. Et quand t'es scientifique, ben tu bosses avec les données que tu as, et tu as rarement le luxe (temps et/ou financement) de tout vérifier et modifier manuellement. Sans compter que le rendu de tes résultats est presque toujours imposé comme étant compatible avec Excel pour publication, relecture, réutilisation, etc. parce que c'est effectivement bien plus partageable qu'un dump de base de données.
Et donc quand Excel t'es imposé à la majorité des étapes de tes travaux, il ne « suffit » pas d'utiliser autre chose, merci d'éviter ce genre de condescendance.
Afficher tout
J’avais un ton condescendant, ça je le reconnais. Mais j’ai plusieurs remarques à propos de ce que tu as écrit.
- Que je sois bien clair : je ne dis pas qu’Excel c’est nul. Mais je maintiens qu’il est généraliste, et ne peut pas tout faire bien, même avec des fonctions avancées comme les macros ou les cubes. Dans la plupart des cas c’est suffisant, mais dès fois non.
- L’open data propose souvent plusieurs formats, dont le CSV qui est présent quasiment partout. Comme tout format il ses avantages et ses limites, mais dans la plupart des cas ça suffit.
- Je pense qu’imposer Excel pour certaines tâches c’est un vrai problème. On devrait utiliser des formats interopérables. Ensuite chacun choisit le logiciel qui lui convient le mieux. techniquement ça ne pose pas de problème. Mais il y a des blocages politiques et idéologiques (et financiers aussi).

Par contre t’as soulevé un point important auquel je n’avais pas pensé : les gens qui traitent les données ne sont pas forcément ceux qui les génèrent. Si on peut demander aux gens qui traitent les données d’utiliser Python, ou R, ou je sais pas quoi de mieux adapteé à la génétique, on ne peut pas demander la même chose à un infirmier. Ça peut être la source de certains problèmes.

Ce qui m’attriste c’est qu’on doive modifier la science pour la rendre compatible avec Excel, plutôt que de faire l’inverse.

a écrit : Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
tout à fait... c'est pas pour rien qu'il y a des formations Exel, on dirait :)

Le plus simple est aussi de taper par exemple 'MARCH5 avec une apostrophe en début de champ pour forcer le format text simple.

a écrit : J’avais un ton condescendant, ça je le reconnais. Mais j’ai plusieurs remarques à propos de ce que tu as écrit.
- Que je sois bien clair : je ne dis pas qu’Excel c’est nul. Mais je maintiens qu’il est généraliste, et ne peut pas tout faire bien, même avec des fonctions avancées comme les macros ou les cubes. Dan
s la plupart des cas c’est suffisant, mais dès fois non.
- L’open data propose souvent plusieurs formats, dont le CSV qui est présent quasiment partout. Comme tout format il ses avantages et ses limites, mais dans la plupart des cas ça suffit.
- Je pense qu’imposer Excel pour certaines tâches c’est un vrai problème. On devrait utiliser des formats interopérables. Ensuite chacun choisit le logiciel qui lui convient le mieux. techniquement ça ne pose pas de problème. Mais il y a des blocages politiques et idéologiques (et financiers aussi).

Par contre t’as soulevé un point important auquel je n’avais pas pensé : les gens qui traitent les données ne sont pas forcément ceux qui les génèrent. Si on peut demander aux gens qui traitent les données d’utiliser Python, ou R, ou je sais pas quoi de mieux adapteé à la génétique, on ne peut pas demander la même chose à un infirmier. Ça peut être la source de certains problèmes.

Ce qui m’attriste c’est qu’on doive modifier la science pour la rendre compatible avec Excel, plutôt que de faire l’inverse.
Afficher tout
Ce qui m’attriste c’est qu’un scientifique ne prenne pas le temps de se former aux outils qu'il utilise.
Forcer en texte une cellule est très simple, et c'est aussi basic de faire ce forçage à l'import de sources étrangères (txt, csv,...).
Le choix de l'outil n'est pas le souci, utiliser d'autres outils lui révèlerait d'autres faux "problèmes"

a écrit : Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
Ça doit être la différence entre la théorie et la pratique... En théorie on peut paramétrer Excel ou formater les cellules en fonction des besoins ou même utiliser un outil plus adapté, en pratique il a été jugé plus simple et efficace, par les personnes concernées, pour éliminer tout risque d'erreur, de changer le nom des gènes qui posaient problème. Et ça fait justement partie de la démarche scientifique de se confronter à la réalité, contrairement aux "yaka" et "fokon" qu'on utilise plutôt en politique et qui n'ont jamais résolu les problèmes.

a écrit : J’approuve totalement. Je pensais que les les chercheurs avaient un niveau d’éducation suffisant pour pouvoir utiliser Excel correctement (c’est vraiment pas compliqué). Et au pire, si Excel ne convient pas, il suffit d’utiliser autre chose. C’est pas les logiciels de traitement de données qui manquent.

Je
trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft. Afficher tout
A mon avis ce problème doit être connu de la communauté scientifique et donc le choix a été pris en conséquence. Une simple anecdote SCMB ne nous permet sûrement pas de percevoir l'ensemble de la problématique...

Je pense qu'elle se résume plutôt à : Quel est le coup et les conséquences des corrections et des effets induits de toutes les erreurs d'inattention et oublis qui conduisent à toutes ces erreurs dans les publications ?

Si ils ont renommé ces gènes, c'est qu'ils ont du conclure après de nombreuses années que c'était comme se battre contre des moulins à vent et donc ils ont préféré changer....

En même temps des pro qui ne sont pas sous Mac ....
Lol

a écrit : En même temps des pro qui ne sont pas sous Mac ....
Lol
J'aimerais bien connaître le rapport entre l'anecdote qui concerne un logiciel et ton commentaire qui parle d'un système d'exploitation. Tu sais que le pack Office existe pour Mac ?

J'aimerais aussi beaucoup connaître le rapport entre "être un professionnel" et "être sous mac".

Cet article explique un peu mieux le problème : www.numerama.com/sciences/641575-il-etait-plus-simple-de-renommer-des-genes-humains-que-de-mettre-a-jour-excel.html

Ce n'est pas 1 ou 2 gênes qui posent problème mais une vingtaine ayant des noms pouvant se transformer en date. Comme la nomenclature des gênes n'est pas si compliqué à changer et que le risque d'erreur est bien trop grand, il est plus simple de changer la nomenclature que de mettre à jour Excel ou trifouiller les données.

a écrit : Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
En fait il suffirait même de modifier les options de correction automatique. Perso je suis toujours avec Excel 2010 ou 2013 (je ne sais plus, ils se ressemblent :D), tu vas dans les options Excel (le logo Office dans le coin en haut à gauche), dans "Vérification", tu as un bouton "Options de correction automatique", une nouvelle fenêtre apparaît, et dans l'onglet "Correction automatique" qui en principe s'ouvre en 1er, tu as des encoches, la dernière c'est "Correction en cours de frappe", tu la décoches et hop. Bien sûr, si tu fais ça, les erreurs d'inattention ne seront plus corrigées, il faudra donc bien se relire :)