День, коли я дізнався, що таке наука про дані

День, коли я дізнався, що таке наука про дані

Що таке наука про дані? Що робить науковець з даних? Як стати вченим з даних? Ці запитання часто задаються на сайтах соціальних медіа, присвячених наукам даних, і часто обговорюються в академічних колах. На ці запитання може бути важко відповісти, оскільки наука про дані така нова і швидко розвивається. Крім того, відповіді значною мірою залежать від походження тих, хто відповідає. Наприклад, інформатик може відповісти з точки зору машинного навчання та оптимізації, тоді як статистик може говорити про помилку вимірювання та умовивід. Прикладні математики можуть мати ще різні думки, фокусуючись на важливості лінійної алгебри та числення. Все правильно, саме це робить науку даних такою багатою та цікавою дисципліною.

Моя власна академічна підготовка грунтується на конкретній галузі біологічного застосування, але формальна підготовка з штучного інтелекту (ШІ), складних адаптивних систем та статистики. Тоді я цього не знав, але моя міждисциплінарна підготовка мене дуже добре підготувала до кар’єри в галузі даних. Більшою частиною свого навчання я завдячую своєму кандидату наук. наставник, який значно випередив час, наполягаючи на тому, що його аспіранти отримують офіційні ступені зі статистики, здобуваючи ступінь доктора філософії. в біомедичній науці. Як результат, я провів свою кар’єру, займаючись дослідженнями в галузі інформатики, статистики та біомедичних наук. Це те, що ми сьогодні називаємо наукою даних.

Коли я працював над доктором наук дисертація, яку мій радник говорив про досягнення зрілості в статистиці. Спочатку я не уявляв, про що він. Після мого четвертого чи п’ятого курсу статистики на рівні випускників це клацнуло. Я роздумував над проблемами, як статистик. Я зрозумів логіку того, як працює статистика, і з першого початку міг побачити шлях до будь-якої проблеми, з якою я зіткнувся. Це, разом з моїми обчислювальними курсовими роботами та дослідженнями в галузі штучного інтелекту та інших областях, таких як нелінійна динаміка, дало мені навички та впевненість у тому, щоб стати вченим даних, яким я є сьогодні.

День, коли я дізнався, що таке наука про дані

Я мав подібне прозріння щодо науки про дані близько 15 років тому, відвідуючи семінар ШІ. Хтось представляв свою роботу над ШІ та алгоритмами машинного навчання для прийняття інвестиційних рішень. Ця людина не була академіком і працювала з невеликою групою, яка інвестувала власні гроші. Його робота включала створення в п'ятницю 50 різних алгоритмів прогнозування для аналізу історичних фінансових даних на вихідних. Потім він вибирав найкращих виконавців і використовував їх для інвестування. Результати, які він показав, продемонстрували чудову продуктивність - тип алгоритму ШІ, який не підкріплений глибиною теорії, якою є такі популярні методи, як нейронні мережі.

В його роботі мене вразило те, що йому було байдуже, який алгоритм вийшов на перше місце. Його турбували лише інвестиційні прибутки. У той момент для мене натиснула наука про дані. Він вирішував проблему по-справжньому дисципліновано-агностичним способом. Зрештою, цінність аналітичного підходу полягає не в цитуваннях чи нагородах. Цінність аналітичного підходу полягає в тому, чи готові ви інвестувати з ними власні гроші.

Наука даних - це не теорія. Мова не йде про десятиліття традицій у таких дисциплінах, як прикладна математика, інформатика та статистика. Справа навіть не в тому науковому методі, який ми відстоюємо в академічних колах. Наука про дані в основі полягає у вирішенні проблеми за допомогою будь-яких інструментів, якими ви маєте у своєму розпорядженні. Мій колега-інвестор не дбав ні про теорію, ні про те, що про нього думають науковці. Він дбав лише про кінцевий результат. Я розглядаю це як практичний підхід, і ми маємо безліч практичних проблем із рішеннями, які могли б допомогти суспільству. Це, звичайно, не означає, що наука про дані не отримує вигоду від знань, що випливають із наукового методу. Це означає, що іноді для досягнення певного результату потрібно проявляти творчість і порушувати дисциплінарні правила.

Наука про дані буде продовжувати розвиватися і, як і у всіх дисциплінах, швидше за все, розвиватиме власні традиції та наукову суворість. Я сподіваюся, що він не втрачає з виду своє походження - вирішувати важкі проблеми, поєднуючи інструменти та методи для досягнення практичного та корисного результату. Наразі це захоплюючий час бути вченим з даних.

Читати далі

Проект, підтриманий NASA, викладає науку про виявлення чужої життя
Проект, підтриманий NASA, викладає науку про виявлення чужої життя

За підтримки НАСА, дослідники одночасно опублікували шість досліджень, які пояснюють, як ми будемо шукати екзопланети для ознак життя, використовуючи сучасні та найближчі технології.

5 наших улюблених аудіокниг для науки і космосу
5 наших улюблених аудіокниг для науки і космосу

Незалежно від того, чи прослуховуєте ви, коли ви їдете на прогулянку, продовжуєте займатися роботою, чи просто хочете відпочити своїм очам, аудіокниги дозволяють легко наздогнати свій список читання. І протягом обмеженого часу, PCMag Shop пропонує підписку про вбивство на ваш перший місяць Audible Gold.

NASA використовуватиме суперкомп'ютера ISS для наукових експериментів
NASA використовуватиме суперкомп'ютера ISS для наукових експериментів

Це було лише там для тестування, але тепер агентство планує використовувати його для обробки даних та експериментів.

Марс Ровер відновлює наукову місію за комп'ютером
Марс Ровер відновлює наукову місію за комп'ютером

Цікавість все ще продовжує діяти після більш ніж шести років, але раніше цього місяця було трохи страшно. НАСА каже, що перевірила, що ровер повністю функціонує, і це відновлення наукових операцій.