Этим «гражданским ученым» часто выражают признательность за то, что они взваливают на себя часть бремени, которое иначе пришлось бы нести профессиональным исследователям, работающим в проектах с участием Больших данных. Любители внесли большой вклад в такие проекты – к примеру, они идентифицируют новые галактики или отслеживают нейронные процессы, и при этом обычно обходятся без традиционных стимулов или мотиваций, таких как зарплата или упоминание авторства. Однако если вы ограничиваете потенциальный вклад исследователей, не получивших формального образования, сбором информации или ее первичной обработкой, значит, они не смогут заниматься планированием исследований, анализом и интерпретацией данных. Отзывы добровольцев – участников научных исследований (например, детей или пациентов) могут помочь профессиональному ученому сделать свое исследование более точным и интересным. Кроме того, у этих групп участников могут иметься свои собственные научные вопросы или они могут высказать новую и необычную точку зрения при интерпретации результатов.
Важно отметить, что наука не ограничивается взрослыми профессионалами. Известны случаи, когда восьмилетние дети становились соавторами научных отчетов. А подростки и подавно делают важные открытия в области здравоохранения с довольно весомыми результатами.
К сожалению, эти начинающие ученые сталкиваются со множеством препятствий, которые незнакомы взрослым профессионалам, получившим формальное образование, – например, с невозможностью доступа к научным публикациям. Хотя все больше академических работ выкладывается в открытый доступ и появляется множество других инициатив в области «открытой науки» – и это делает научную среду более дружелюбной для «ученых выходного дня», – многие традиционные научные практики по-прежнему недоступны для любителей, не получающих необходимого для них финансирования.
Наше представление о себе, которое мы получаем посредством научных исследований, может оказаться искаженным, поскольку в большинстве психологических исследований выборка участников вовсе не представляет все население в целом. Чаще всего эти участники принадлежат к так называемой группе WEIRD (Western, Educated, Industrialized, Rich, Democratic – представители западной цивилизации, образованные, живущие в индустриальном обществе богатых демократий); они же обычно привлекаются и для участия в неклинических нейровизуализационных исследованиях. Угроза того, что на результатах исследования отразится групповая предвзятость, заставляет ученых активнее искать более репрезентативные выборки; однако тревоги по поводу того, что и сами ученые, как правило, относятся к группе WEIRD, что-то не слышно.
Таким образом, если большинство научных исследований, получивших финансирование и впоследствии опубликованных, было проведено исключительно силами людей, принадлежащих к одной и той же страте – профессиональных ученых, получивших формальное академическое образование, – мы видим потенциальную опасность искажения результатов и интерпретаций. В то же время ученые-любители, не вполне вписывающиеся в академические рамки, однако тоже интересующиеся познанием мира с помощью научного метода, должны преодолеть множество барьеров.
Проекты (и даже исследователи), собирающие средства с помощью краудфандинга, постепенно начинают получать признание со стороны официальных ученых, которые зависят от грантов и позиций в академической иерархии. Однако провести некоторые научные эксперименты – к примеру, исследования с участием добровольцев – без институциональной поддержки крайне сложно, если вообще возможно. Хотя поддерживаемая общественностью система сдержек и противовесов по-прежнему крайне важна для научных проектов, ей самой стоило бы в некоторых случаях избавиться от традиционных академических формальностей и ограничений.
День ото дня средства сбора и анализа данных становятся все более доступными для непрофессионалов. И для того, чтобы успешно встроить в науку тех, кто ведет свои исследования за пределами привычных академических рамок, нам предстоит обсудить новые этические вопросы и построить новые инфраструктуры. Проделав это, мы увидим, как растет число научных открытий, совершенных «гражданскими учеными» всех возрастов и профессий. Эти до сих пор почти не слышные голоса наконец-то смогут громко заявить о ценности своего вклада в наше познание мира.
Научный методМелани Суон
Системный аналитик; футуролог; эксперт в области прикладной генетики; руководитель MS Futures Group; основатель компании DIYgenomics.
Главная научная идея, прежде всего заслуживающая отставки, – это само понятие «научный метод». Точнее, я имею в виду представление о том, что существует якобы лишь один научный метод, единственный и исключительный способ получения научных результатов. Однако этот традиционный, эксклюзивный научный метод перестал быть адекватным в новых ситуациях, возникающих в современной науке, – таких как Большие данные, краудсорсинг или синтетическая биология. Проверка гипотез путем наблюдений, измерений и экспериментов имела смысл в прошлом, когда получение информации было сложным и дорогостоящим процессом; однако теперь это уже не так.
В последние десятилетия мы пытались адаптироваться к новой эпохе информационного изобилия, облегчившего планирование и повторение экспериментов. Одним из результатов этого стало появление новой вычислительной дисциплины практически в любой области науки – к примеру, вычислительной биологии или цифровой архивации рукописей. Информационное изобилие и развитие вычислительных технологий изменили направление развития академического дискурса, который теперь не обязательно придерживается традиционного научного метода. И особых успехов мы смогли достичь в трех областях.
Одна из масштабных тенденций, меняющих ход науки, связана с Большими данными – созданием и использованием гигантских и сложных наборов данных на основе облачных технологий. Масштаб Больших данных почти безграничен: организации непрерывно экспортируют миллионы транзакций в час в базы данных размером в сотни петабайт. Общий объем цифровой информации в мире в настоящее время удваивается примерно каждые 18 месяцев. Но еще до наступления эры Big Data процессы моделирования и прогнозирования уже превратились в ключевые этапы вычислений в научных процессах, а новые методы, требующиеся для работы с Большими данными, делают традиционный научный метод еще менее релевантным. Наши отношения с информацией изменились. Ранее, в эпоху нехватки информации, любые данные были заметны. К примеру, в календаре каждый элемент информации о назначенной встрече был важен и предполагал какое-то действие. С Большими данными справедливым стало обратное: 99 % данных оказываются ненужными (немедленно, или со временем, или в результате обработки). Теперь наша главная задача – извлечение крупиц релевантной информации из огромных ее массивов, поиск сигналов, аномалий и исключений в шуме – к примеру, геномного полиморфизма. Следующий уровень обработки Больших данных – это распознавание паттернов. Высокая частота выборки позволяет не только точечно тестировать феномены (как это происходило и при традиционном научном методе), но и полностью объяснять их во временно́й динамике и при различных условиях. Впервые мы можем заняться расчетами продолжительных базовых норм, дисперсии, закономерностей и циклического поведения. Но для этого требуется мышление, не ограниченное простыми соображениями причинности (как в традиционном научном методе). Нам необходимы расширенные, системные модели корреляции, ассоциации и оценки отдельных эпизодов-триггеров. Некоторые из самых передовых методов работы с Большими данными включают в себя алгоритмы машинного обучения, нейронные сети, иерархическое представление данных и визуализацию информации.
Краудсорсинг – организованная через интернет совместная работа множества участников над каким-то общим процессом – это еще одна тенденция, меняющая форму научных исследований. Различные модели краудсорсинга привели к развитию научной экосистемы, на одной стороне которой может находиться получивший профессиональную подготовку институциональный ученый, пользующийся традиционным научным методом, а на другой – ученый-любитель, изучающий вопросы, интересные лично для него, с помощью огромного количества различных методов. Между этими двумя полюсами располагаются их общие коллеги, в различной степени профессионально организованные и по-разному координирующие свои усилия. Интернет (и постепенное объединение человечества с его помощью – к 2020 году, согласно прогнозам, число пользователей Сети достигнет 5 млрд) – позволяет науке развиваться в совершенно ином масштабе. Дело не только в том, что в краудсорсинговых группах стандартные исследования проводятся быстрее и стоят дешевле: сегодня мы в состоянии проводить исследования, в сотни раз более масштабные и детализированные.
Группа исследователей способна предоставить огромные массивы информации, просто подключив к общей базе свои личные гаджеты, настроенные на сбор данных по принципу «измерения себя» (quantified self). Ученые-любители принимают участие в простых процессах обработки информации и в других видах сбора и анализа данных через веб-сайты типа Galaxy Zoo. Участников таких проектов подбирают через (также выстроенные по принципу краудсорсинга) площадки найма рабочей силы (первоначально все они были похожи на площадку Mechanical Turk («Механический турок»), принадлежащую Amazon.com, однако теперь всё больше ориентируются на профессиональные навыки кандидатов), соревнования по скорости обработке данных и «игровые» научные проекты (например, в таких областях, как прогнозирование складывания белков и структура РНК). Новые методы науки подкрепляются появлением новых инструментов – работы по принципу DIY («сделай сам»), «измерения себя», биохакинга, трехмерной печати и совместных исследований.
Третьей масштабной тенденцией, меняющей образ науки, можно считать синтетическую биологию. Это направление науки, получившее, благодаря своему трансформационному потенциалу, неформальное прозвище «Транзистор XXI века», предназначено для проектирования и создания биологических устройств и систем. Синтетическая биология позволяет объединять исследовательские усилия в области биологии, инженерии, функционального дизайна и вычислений. Одна из ключевых сфер ее применения – метаболический инжиниринг, то есть работа с клетками с целью увеличить производство ими различных субстанций (которые затем могут использоваться для решения задач энергетики, сельского хозяйства и фармацевтики). По само́й своей природе синтетическая биология нацелена на проактивное создание совершенно новых биологических систем и организмов. Можно сказать, что этот подход противоположен пассивному описанию явлений, для которого изначально и был изобретен научный метод. И если оптимизацию генетических и регуляционных процессов внутри клеток можно, хотя бы отчасти, описать с помощью научного метода, то общий диапазон возможностей и методов в рамках этой новой науки значительно шире. Создание новых организмов и функций «с нуля» требует совершенно иной научной методологии, чем та, что поддерживается традиционным научным методом. Нам необходимо переосмыслить науку, которая становится теперь инструментом не только описания явлений, но и их создания. Мы больше не можем полагаться исключительно на традиционный научный метод в новых областях науки.