День, когда я узнал, что такое наука о данных

День, когда я узнал, что такое наука о данных

Что такое наука о данных? Чем занимается аналитик данных? Как мне стать специалистом по данным? Эти вопросы обычно задают на сайтах социальных сетей по анализу данных и часто обсуждаются в академических кругах. На эти вопросы может быть сложно ответить, потому что наука о данных настолько нова и быстро развивается. Кроме того, ответы во многом зависят от опыта тех, кто отвечает. Например, ученый-информатик может ответить на вопрос о машинном обучении и оптимизации, а статистик - об ошибке измерения и выводе. У прикладных математиков может быть другой взгляд на важность линейной алгебры и исчисления. Все верны, что делает науку о данных такой богатой и интересной дисциплиной.

Моя собственная академическая подготовка основана на конкретной области биологических приложений, но с формальным обучением искусственному интеллекту (ИИ), сложным адаптивным системам и статистике. В то время я этого не знал, но моя междисциплинарная подготовка очень хорошо подготовила меня к карьере в области науки о данных. Я многим обязан своей докторской степенью. наставник, который значительно опередил время, настояв на том, чтобы его аспиранты получали формальные ученые степени по статистике и одновременно получали докторскую степень в биомедицинской науке. В результате я провел свою карьеру, занимаясь исследованиями на стыке компьютерных наук, статистики и биомедицинских наук. Это то, что мы сегодня называем наукой о данных.

Когда я работал над своей докторской диссертацией. В своей диссертации мой научный руководитель говорил о достижении зрелости в статистике. Сначала я понятия не имел, о чем он говорит. После моего четвертого или пятого курса статистики для выпускников он щелкнул. Я обнаружил, что обдумываю проблемы, как статистик. Я понимал логику того, как работает статистика, и мог сначала увидеть путь вперед для любой проблемы, с которой я столкнулся. Это, наряду с моими вычислительными курсами и исследованиями в области искусственного интеллекта и других областей, таких как нелинейная динамика, дало мне навыки и уверенность, чтобы стать специалистом по данным, которым я являюсь сегодня.

День, когда я узнал, что такое наука о данных

У меня было подобное прозрение о науке о данных около 15 лет назад, когда я посещал семинар по ИИ. Кто-то представлял свои работы по AI и алгоритмам машинного обучения для принятия инвестиционных решений. Этот человек не был академиком и работал с небольшой группой, которая вкладывала собственные деньги. Его работа заключалась в настройке 50 различных алгоритмов прогнозирования в пятницу для анализа исторических финансовых данных за выходные. Затем он выбирал лучших исполнителей и использовал их для инвестиций. Результаты, которые он продемонстрировал, продемонстрировали превосходную производительность типа алгоритма искусственного интеллекта, который не подкреплен глубиной теории, которой являются популярные методы, такие как нейронные сети.

Что меня поразило в его работе, так это то, что ему было все равно, какой алгоритм окажется лучше. Его интересовала только инвестиционная прибыль. Именно в этот момент я заинтересовался наукой о данных. Он решал проблему по-настоящему независимым от дисциплины способом. В конце концов, ценность аналитического подхода - это не цитаты или награды. Ценность аналитического подхода заключается в том, готовы ли вы вложить в него свои деньги.

Наука о данных - это не теория. Речь идет не о десятилетиях традиций в таких дисциплинах, как прикладная математика, информатика и статистика. Дело даже не в научном методе, который мы отстаиваем в академических кругах. В основе науки о данных лежит решение проблемы любыми инструментами, которые есть в вашем распоряжении. Моего коллегу-инвестора не волновала теория или то, что о нем думают ученые. Его заботил только конечный результат. Я рассматриваю это как практический подход, и у нас есть множество практических проблем, решения которых помогли бы обществу. Это, конечно, не означает, что наука о данных не извлекает выгоду из знаний, полученных с помощью научного метода. Это означает, что иногда необходимо проявлять творческий подход и нарушать дисциплинарные правила для достижения определенного результата.

Наука о данных будет продолжать развиваться и, как и все дисциплины, вероятно, будет развивать свои собственные традиции и научную строгость. Я надеюсь, что он не упускает из виду свое происхождение - решение сложных проблем путем объединения инструментов и методов для достижения практического и полезного результата. На данный момент настало захватывающее время для специалиста по данным.

Читать далее

SpaceX планирует скорое испытание космического корабля на большой высоте
SpaceX планирует скорое испытание космического корабля на большой высоте

После успешного статического огневого испытания на этой неделе генеральный директор SpaceX Илон Маск объявил в Twitter, что компания хочет выполнить испытательный полет на большой высоте уже на следующей неделе.

Этот гигантский коготь скоро сможет убрать космический мусор
Этот гигантский коготь скоро сможет убрать космический мусор

Очистить пространство для предотвращения столкновений - сложная задача, но ЕКА только что профинансировало гигантскую космическую клешню, которая может указать путь вперед.

Худшие процессоры из когда-либо созданных
Худшие процессоры из когда-либо созданных

Большую часть времени в wfoojjaec мы чествуем лучшие технологии. Сегодня мы приветствуем худшее.

Лучшие процессоры из когда-либо созданных
Лучшие процессоры из когда-либо созданных

За последние 40 лет было разработано и построено множество микросхем, но лишь немногие заслуживают того, чтобы их называли лучшими из лучших. Мы округляем их по рабочим станциям, настольным компьютерам, ноутбукам и мобильным устройствам.