День, когда я узнал, что такое наука о данных

День, когда я узнал, что такое наука о данных

Что такое наука о данных? Чем занимается аналитик данных? Как мне стать специалистом по данным? Эти вопросы обычно задают на сайтах социальных сетей по анализу данных и часто обсуждаются в академических кругах. На эти вопросы может быть сложно ответить, потому что наука о данных настолько нова и быстро развивается. Кроме того, ответы во многом зависят от опыта тех, кто отвечает. Например, ученый-информатик может ответить на вопрос о машинном обучении и оптимизации, а статистик - об ошибке измерения и выводе. У прикладных математиков может быть другой взгляд на важность линейной алгебры и исчисления. Все верны, что делает науку о данных такой богатой и интересной дисциплиной.

Моя собственная академическая подготовка основана на конкретной области биологических приложений, но с формальным обучением искусственному интеллекту (ИИ), сложным адаптивным системам и статистике. В то время я этого не знал, но моя междисциплинарная подготовка очень хорошо подготовила меня к карьере в области науки о данных. Я многим обязан своей докторской степенью. наставник, который значительно опередил время, настояв на том, чтобы его аспиранты получали формальные ученые степени по статистике и одновременно получали докторскую степень в биомедицинской науке. В результате я провел свою карьеру, занимаясь исследованиями на стыке компьютерных наук, статистики и биомедицинских наук. Это то, что мы сегодня называем наукой о данных.

Когда я работал над своей докторской диссертацией. В своей диссертации мой научный руководитель говорил о достижении зрелости в статистике. Сначала я понятия не имел, о чем он говорит. После моего четвертого или пятого курса статистики для выпускников он щелкнул. Я обнаружил, что обдумываю проблемы, как статистик. Я понимал логику того, как работает статистика, и мог сначала увидеть путь вперед для любой проблемы, с которой я столкнулся. Это, наряду с моими вычислительными курсами и исследованиями в области искусственного интеллекта и других областей, таких как нелинейная динамика, дало мне навыки и уверенность, чтобы стать специалистом по данным, которым я являюсь сегодня.

День, когда я узнал, что такое наука о данных

У меня было подобное прозрение о науке о данных около 15 лет назад, когда я посещал семинар по ИИ. Кто-то представлял свои работы по AI и алгоритмам машинного обучения для принятия инвестиционных решений. Этот человек не был академиком и работал с небольшой группой, которая вкладывала собственные деньги. Его работа заключалась в настройке 50 различных алгоритмов прогнозирования в пятницу для анализа исторических финансовых данных за выходные. Затем он выбирал лучших исполнителей и использовал их для инвестиций. Результаты, которые он продемонстрировал, продемонстрировали превосходную производительность типа алгоритма искусственного интеллекта, который не подкреплен глубиной теории, которой являются популярные методы, такие как нейронные сети.

Что меня поразило в его работе, так это то, что ему было все равно, какой алгоритм окажется лучше. Его интересовала только инвестиционная прибыль. Именно в этот момент я заинтересовался наукой о данных. Он решал проблему по-настоящему независимым от дисциплины способом. В конце концов, ценность аналитического подхода - это не цитаты или награды. Ценность аналитического подхода заключается в том, готовы ли вы вложить в него свои деньги.

Наука о данных - это не теория. Речь идет не о десятилетиях традиций в таких дисциплинах, как прикладная математика, информатика и статистика. Дело даже не в научном методе, который мы отстаиваем в академических кругах. В основе науки о данных лежит решение проблемы любыми инструментами, которые есть в вашем распоряжении. Моего коллегу-инвестора не волновала теория или то, что о нем думают ученые. Его заботил только конечный результат. Я рассматриваю это как практический подход, и у нас есть множество практических проблем, решения которых помогли бы обществу. Это, конечно, не означает, что наука о данных не извлекает выгоду из знаний, полученных с помощью научного метода. Это означает, что иногда необходимо проявлять творческий подход и нарушать дисциплинарные правила для достижения определенного результата.

Наука о данных будет продолжать развиваться и, как и все дисциплины, вероятно, будет развивать свои собственные традиции и научную строгость. Я надеюсь, что он не упускает из виду свое происхождение - решение сложных проблем путем объединения инструментов и методов для достижения практического и полезного результата. На данный момент настало захватывающее время для специалиста по данным.

Читать далее

Астрономы могут наконец узнать источник быстрых радиовсплесков
Астрономы могут наконец узнать источник быстрых радиовсплесков

Три новых исследования сообщают о FRB в нашей галактике. Поскольку эта была намного ближе, чем прошлые сигналы, ученые смогли отследить ее до определенного типа нейтронной звезды, известной как магнитар.

Дельфины узнают компаньонов по вкусу своей мочи
Дельфины узнают компаньонов по вкусу своей мочи

Ранее на этой неделе мы узнали, что узкие дильфины самимт, потирая их тела по кораллам. Но особый интеллект этого морского существа, похоже, на этом не останавливается.

DART Craft в НАСА может оставить астероид «неузнаваемым»: исследование
DART Craft в НАСА может оставить астероид «неузнаваемым»: исследование

У диаметром всего 560 футов (170 метров) НАСА ожидал, что 500-килограмм Дарт оставил кратер и повлияет на орбиту спутника вокруг более крупных дидимо. Не так, говорит новое исследование.

Астрономы могут наконец узнать, почему Eta Carinae прервали 170 лет назад
Астрономы могут наконец узнать, почему Eta Carinae прервали 170 лет назад

Команда международных астрономов думает, что они разработали то, что вызвало извержение: почти непостижимую передачу массы между звездами.