День, коли я дізнався, що таке наука про дані

День, коли я дізнався, що таке наука про дані

Що таке наука про дані? Що робить науковець з даних? Як стати вченим з даних? Ці запитання часто задаються на сайтах соціальних медіа, присвячених наукам даних, і часто обговорюються в академічних колах. На ці запитання може бути важко відповісти, оскільки наука про дані така нова і швидко розвивається. Крім того, відповіді значною мірою залежать від походження тих, хто відповідає. Наприклад, інформатик може відповісти з точки зору машинного навчання та оптимізації, тоді як статистик може говорити про помилку вимірювання та умовивід. Прикладні математики можуть мати ще різні думки, фокусуючись на важливості лінійної алгебри та числення. Все правильно, саме це робить науку даних такою багатою та цікавою дисципліною.

Моя власна академічна підготовка грунтується на конкретній галузі біологічного застосування, але формальна підготовка з штучного інтелекту (ШІ), складних адаптивних систем та статистики. Тоді я цього не знав, але моя міждисциплінарна підготовка мене дуже добре підготувала до кар’єри в галузі даних. Більшою частиною свого навчання я завдячую своєму кандидату наук. наставник, який значно випередив час, наполягаючи на тому, що його аспіранти отримують офіційні ступені зі статистики, здобуваючи ступінь доктора філософії. в біомедичній науці. Як результат, я провів свою кар’єру, займаючись дослідженнями в галузі інформатики, статистики та біомедичних наук. Це те, що ми сьогодні називаємо наукою даних.

Коли я працював над доктором наук дисертація, яку мій радник говорив про досягнення зрілості в статистиці. Спочатку я не уявляв, про що він. Після мого четвертого чи п’ятого курсу статистики на рівні випускників це клацнуло. Я роздумував над проблемами, як статистик. Я зрозумів логіку того, як працює статистика, і з першого початку міг побачити шлях до будь-якої проблеми, з якою я зіткнувся. Це, разом з моїми обчислювальними курсовими роботами та дослідженнями в галузі штучного інтелекту та інших областях, таких як нелінійна динаміка, дало мені навички та впевненість у тому, щоб стати вченим даних, яким я є сьогодні.

День, коли я дізнався, що таке наука про дані

Я мав подібне прозріння щодо науки про дані близько 15 років тому, відвідуючи семінар ШІ. Хтось представляв свою роботу над ШІ та алгоритмами машинного навчання для прийняття інвестиційних рішень. Ця людина не була академіком і працювала з невеликою групою, яка інвестувала власні гроші. Його робота включала створення в п'ятницю 50 різних алгоритмів прогнозування для аналізу історичних фінансових даних на вихідних. Потім він вибирав найкращих виконавців і використовував їх для інвестування. Результати, які він показав, продемонстрували чудову продуктивність - тип алгоритму ШІ, який не підкріплений глибиною теорії, якою є такі популярні методи, як нейронні мережі.

В його роботі мене вразило те, що йому було байдуже, який алгоритм вийшов на перше місце. Його турбували лише інвестиційні прибутки. У той момент для мене натиснула наука про дані. Він вирішував проблему по-справжньому дисципліновано-агностичним способом. Зрештою, цінність аналітичного підходу полягає не в цитуваннях чи нагородах. Цінність аналітичного підходу полягає в тому, чи готові ви інвестувати з ними власні гроші.

Наука даних - це не теорія. Мова не йде про десятиліття традицій у таких дисциплінах, як прикладна математика, інформатика та статистика. Справа навіть не в тому науковому методі, який ми відстоюємо в академічних колах. Наука про дані в основі полягає у вирішенні проблеми за допомогою будь-яких інструментів, якими ви маєте у своєму розпорядженні. Мій колега-інвестор не дбав ні про теорію, ні про те, що про нього думають науковці. Він дбав лише про кінцевий результат. Я розглядаю це як практичний підхід, і ми маємо безліч практичних проблем із рішеннями, які могли б допомогти суспільству. Це, звичайно, не означає, що наука про дані не отримує вигоду від знань, що випливають із наукового методу. Це означає, що іноді для досягнення певного результату потрібно проявляти творчість і порушувати дисциплінарні правила.

Наука про дані буде продовжувати розвиватися і, як і у всіх дисциплінах, швидше за все, розвиватиме власні традиції та наукову суворість. Я сподіваюся, що він не втрачає з виду своє походження - вирішувати важкі проблеми, поєднуючи інструменти та методи для досягнення практичного та корисного результату. Наразі це захоплюючий час бути вченим з даних.