День, когда я узнал, что такое наука о данных

День, когда я узнал, что такое наука о данных

Что такое наука о данных? Чем занимается аналитик данных? Как мне стать специалистом по данным? Эти вопросы обычно задают на сайтах социальных сетей по анализу данных и часто обсуждаются в академических кругах. На эти вопросы может быть сложно ответить, потому что наука о данных настолько нова и быстро развивается. Кроме того, ответы во многом зависят от опыта тех, кто отвечает. Например, ученый-информатик может ответить на вопрос о машинном обучении и оптимизации, а статистик - об ошибке измерения и выводе. У прикладных математиков может быть другой взгляд на важность линейной алгебры и исчисления. Все верны, что делает науку о данных такой богатой и интересной дисциплиной.

Моя собственная академическая подготовка основана на конкретной области биологических приложений, но с формальным обучением искусственному интеллекту (ИИ), сложным адаптивным системам и статистике. В то время я этого не знал, но моя междисциплинарная подготовка очень хорошо подготовила меня к карьере в области науки о данных. Я многим обязан своей докторской степенью. наставник, который значительно опередил время, настояв на том, чтобы его аспиранты получали формальные ученые степени по статистике и одновременно получали докторскую степень в биомедицинской науке. В результате я провел свою карьеру, занимаясь исследованиями на стыке компьютерных наук, статистики и биомедицинских наук. Это то, что мы сегодня называем наукой о данных.

Когда я работал над своей докторской диссертацией. В своей диссертации мой научный руководитель говорил о достижении зрелости в статистике. Сначала я понятия не имел, о чем он говорит. После моего четвертого или пятого курса статистики для выпускников он щелкнул. Я обнаружил, что обдумываю проблемы, как статистик. Я понимал логику того, как работает статистика, и мог сначала увидеть путь вперед для любой проблемы, с которой я столкнулся. Это, наряду с моими вычислительными курсами и исследованиями в области искусственного интеллекта и других областей, таких как нелинейная динамика, дало мне навыки и уверенность, чтобы стать специалистом по данным, которым я являюсь сегодня.

День, когда я узнал, что такое наука о данных

У меня было подобное прозрение о науке о данных около 15 лет назад, когда я посещал семинар по ИИ. Кто-то представлял свои работы по AI и алгоритмам машинного обучения для принятия инвестиционных решений. Этот человек не был академиком и работал с небольшой группой, которая вкладывала собственные деньги. Его работа заключалась в настройке 50 различных алгоритмов прогнозирования в пятницу для анализа исторических финансовых данных за выходные. Затем он выбирал лучших исполнителей и использовал их для инвестиций. Результаты, которые он продемонстрировал, продемонстрировали превосходную производительность типа алгоритма искусственного интеллекта, который не подкреплен глубиной теории, которой являются популярные методы, такие как нейронные сети.

Что меня поразило в его работе, так это то, что ему было все равно, какой алгоритм окажется лучше. Его интересовала только инвестиционная прибыль. Именно в этот момент я заинтересовался наукой о данных. Он решал проблему по-настоящему независимым от дисциплины способом. В конце концов, ценность аналитического подхода - это не цитаты или награды. Ценность аналитического подхода заключается в том, готовы ли вы вложить в него свои деньги.

Наука о данных - это не теория. Речь идет не о десятилетиях традиций в таких дисциплинах, как прикладная математика, информатика и статистика. Дело даже не в научном методе, который мы отстаиваем в академических кругах. В основе науки о данных лежит решение проблемы любыми инструментами, которые есть в вашем распоряжении. Моего коллегу-инвестора не волновала теория или то, что о нем думают ученые. Его заботил только конечный результат. Я рассматриваю это как практический подход, и у нас есть множество практических проблем, решения которых помогли бы обществу. Это, конечно, не означает, что наука о данных не извлекает выгоду из знаний, полученных с помощью научного метода. Это означает, что иногда необходимо проявлять творческий подход и нарушать дисциплинарные правила для достижения определенного результата.

Наука о данных будет продолжать развиваться и, как и все дисциплины, вероятно, будет развивать свои собственные традиции и научную строгость. Я надеюсь, что он не упускает из виду свое происхождение - решение сложных проблем путем объединения инструментов и методов для достижения практического и полезного результата. На данный момент настало захватывающее время для специалиста по данным.

Читать далее

Защитите свою конфиденциальность в Интернете с помощью 5 лучших VPN
Защитите свою конфиденциальность в Интернете с помощью 5 лучших VPN

В настоящее время инвестировать в VPN - разумный выбор, но вариантов очень много. Чтобы немного сузить круг вопросов, мы собрали пять наших самых любимых потребительских услуг.

PlayStation 5 будет доступна в сети только в день запуска
PlayStation 5 будет доступна в сети только в день запуска

PlayStation 5 не будет доступна в магазинах в день запуска, и если вы захотите приобрести твердотельный накопитель M.2, чтобы расширить его хранилище, у вас будет время подумать об этой покупке.

Массивный взрыв "Килонова" показывает первое наблюдаемое рождение магнетара
Массивный взрыв "Килонова" показывает первое наблюдаемое рождение магнетара

Мы никогда не видели возникновения магнетара, но новое высокоэнергетическое событие на расстоянии нескольких миллиардов световых лет может быть первым - килонова, которая сигнализирует о слиянии двух нейтронных звезд.

Intel распространяет FUD о якобы огромном падении производительности Ryzen 4000 от батареи
Intel распространяет FUD о якобы огромном падении производительности Ryzen 4000 от батареи

Intel считает, что представила доказательства, опровергающие ценность стека продуктов AMD Ryzen 4000. Intel ошибается.