Геном людини містить тисячі генів, і для роботи з ними вчені присвоїли їм імена у вигляді цифро-буквеного коду. Однак через особливість Microsoft Excel останнім часом ученим довелося змінити імена 27 людських генів. Це виявилося простіше, ніж написати патч для редактора таблиць Microsoft і виправити проблему, що тягнеться мінімум з 2016 року.
Проблема криється в тому, що Excel розпізнає назву деяких генів як дату. Наприклад, ген MARCH1 – це скорочення від Membrane Associated Ring-CH-Type Finger 1 (мембранно-асоціюваний палець типу CH). Excel же впевнений, що це дата 1 березня.
Аналіз показав, що 20% даних у дослідженнях генома постраждали від помилки Excel. Цей редактор таблиць є розповсюдженим і часто стає першим вибором при аналізі генів.
Підписуйтесь на наш канал у Telegram: https://t.me/techtodayua
Пошкодження даних про геном не лише неприємне, а й небезпечне. Учені змушені виправляти їх вручну, проте це не гарантує, що Excel на іншому комп’ютері знову не змінить дані на свій лад.
Комітет стандартизації назв генів HUGO Gene Nomenclature Committee (HGNC) опублікував нові правила назв, які враховують особливість Excel. Наприклад, MARCH1 тепер став MARCHF1.
Чому Microsoft не внесла правки в Excel, точно невідомо. Представники HGNC вважають, що компанія не вважає проблему вартою уваги. Адже генетики є дуже невеликою групою користувачів. При цьому функція розпізнавання дат в Excel широко використовується значною кількістю користувачів цього редактора таблиць.