Аритмия чувств — страница 24 из 42

Дорога. Отчего же, два кружочка — и готово.

Януш (смеется). Может быть, ты действительно так думаешь, но ты очень ошибаешься. Любой химик, как и любой мужчина, видит тебя несколько иначе. Ты уникальна, и каждый, кто услышит твою фамилию, должен тебя нарисовать одинаково — в России, в Соединенных Штатах, в Германии или в Польше.

Дорота. И вы, господа, создали такую номенклатуру?

Януш. Эта номенклатура уже существовала, к сожалению, издавна. Если бы ее создали мы, то все было бы намного проще. А перевод этой структуры, заключенной в названии, является сложным процессом. Его устанавливают более шестисот различных правил, из которых имеется шестьдесят тысяч различных исключений. А эти названия необходимы, потому что никто не зарегистрирует нового лекарства или новой химической субстанции, если не пошлет название этой субстанции в РОА, то есть в Федеральное управление по контролю качества пищевых продуктов и лекарственных средств. И это должно быть правильное, систематическое химическое название. Его присваивают химики. Они сидят по восемь часов и называют эти структуры в соответствии с правилами номенклатуры. Смотрит такой химик на экран компьютера или на страничку, на которой нарисована структура, и говорит, что это, например, двуметилоаминофосфорин чего-то там. Посмотрел на структуру и записал название. Если у него хороший день, то он в состоянии отсмотреть примерно сто таких структур и присвоить им названия, а ведь некоторые из них занимают по три строчки, поскольку в них появляются разные заменители. Вероятность того, что он допустит ошибку в этих весьма сложных структурах, довольно велика. А кроме того, химики — обычные люди: то заболтаются, то на ланч отвлекутся, то жена или товарищ позвонят. А это все стоит денег. В моей фирме было семь химиков, и каждый зарабатывал сто тысяч марок в год, и, следовательно, моя фирма платила семьсот тысяч марок ежегодно этим семерым сотрудникам. Какое-то время спустя в фирме родилась мысль: а нельзя ли написать специальную программу, которая сама проанализирует эти структуры и присвоит им названия.

Дорота. И ты ее придумал?

Януш. Я ее написал.

Дорота. И лишил работы семерых химиков.

Януш. К сожалению. И поэтому меня не особенно любили в этой фирме. До меня никто подобной программы

не разрабатывал. Планировалось, что если мне не удастся написать в течение года такую программу, если не будет результатов, то со мной не продлят договора и тогда мне придется вернуться в Торунь, а мое начальство таким образом убедится, что написание данной программы невозможно или экономически невыгодно. Правил более шестисот, но самое трудное — это исключения, потому что тут появляются специфические названия и специфический язык. И как в любом языке, в нем имеются диалекты. Американцы говорят на чуточку ином химическом диалекте, чем европейцы. Я не могу изменить мир и заставить всех говорить на одном диалекте, а значит, это именно я должен приспособиться к их диалектам при создании разных названий для одной и той же структуры, которые в результате станут понятными и американцу, и европейцу. Это было непросто, но я такую программу написал.

Дорота. Первый в мире.

Януш. Первый в мире. На это у меня ушло четыре года.

Дорота. И она у тебя запатентована?

Януш. Я не мог ее запатентовать, это могла сделать только фирма, на которую я работал. Никто не может, не заплатив фирме, использовать данную программу. Если кто-то другой напишет, взяв за основу твою, программу лучшего качества, то не сможет запатентовать ее, так как нельзя запатентовать мысль. Но если кто-то создаст подобную программу, не зная о существовании твоей, то он имеет на нее право. И тогда дело будет обстоять так, как это происходит с операционными системами Арр1е и \Ушс1очуз. Это две параллельные операционные системы — одна лучше, а другая хуже. Но тогда никто такой программы еще не создал — я был первым. Это позволило сэкономить огромные деньги. Тех семерых человек не уволили, их лишь перевели в другие отделы. Но двое из них должны были остаться, потому что программа неидеальна, у нее лишь определенный зиссезз гаЬе, то есть уровень успешности, так что человек пока еще должен контролировать предоставляемые программой результаты. В 80% случаев моя программа дает правильные названия; в течение одного дня химик обрабатывает сто структур, тогда как программа — четыреста тысяч.

Дорота. Хорошо. Ты уже создал эту программу, над чем работаешь сейчас?

Януш. Позже появилась новая проблема. Очень часто у нас есть название соединения, например прозак, виагра или ацетилсалициловая кислота, являющаяся активным компонентом в аспирине. И кто-то вписывает в интернетовском поисковике ацетилсалициловую кислоту, желая, чтобы на экране выскочила структура кислоты. Таким образом, он хочет чего-то обратного. Людям кажется, что это очень просто — заставить мою программу работать в обратном направлении. То есть если раньше в основе программы лежал переход от структуры к языку, то теперь это переход от языка к структуре. Вход в мою первую программу (от структур к названиям) вполне однозначен, поскольку во всем мире используется одна и та же структура, хотя названий может быть несколько. Стало быть, вход вполне определенный, но выход может быть разным в рамках этих разных химических диалектов. Во второй же программе вход неоднозначен, поскольку у одного и того же вещества может быть несколько названий или несколько вариантов написаний одного названия. Я же должен предусмотреть все это разнообразие вариантов и вывести для них одну-единственную структуру. Например, кто-то может писать «ацетило-салициловая кислота» через дефис, а кто-то другой без дефиса. И это проблема. И все же я такую программу написал. Для чего она нам нужна? Например, моя фирма ищет информацию о химических соединениях в профессиональной литературе, в которой информация содержится главным образом в патентах. В последнее время все меньше публикуют информацию о новых соединениях, а сразу их патентуют, ведь никогда не известно, не появится ли вслед за этим какая-нибудь новая программа, не скрываются ли за этим новые деньги. Так что лучше на всякий случай сразу запатентовать свое ноу-хау. Когда-то человек, сделавший какое-нибудь открытие, немедленно знакомил с ним

общественность, и каждый мог им воспользоваться. Но теперь это не так. Теперь большинство соединений сначала патентуется, и на эту тему появляются не научные статьи, а лишь информация о запатентованных соединениях. И хуже всего то, что химики не рисуют эти структуры в патентах, а лишь приводят их название. Мы же должны в базу данных ввести не только название, но и структуру. Даже если бы мы приняли на работу русского или поляка, труд которых ценится дешево, которым за одну структуру платят семь евро, то и тогда вложенные деньги не окупились бы. И потому родился замысел написать программу, которая сэкономит миллионы евро и приведет к тому, что большинство структур будет автоматически переведено. Этим я и занимался последующую часть жизни. Эти структуры записываются и рисуются в системах разных стандартов, подобно тому как, например, в телевидении существуют системы РАЬ либо КТ5С. К сожалению, не везде существуют стандарты и необходимо переносить их из одной формы в другую, из одного способа записи структур в другой. И такую конверсию этих структур я произвожу. Мы обладаем базой данных, и теперь я буду заниматься авторизацией ее пользователей. А за информацию в моей фирме платят. Вот такими различными мелкими, трехмесячными проектами я занимаюсь в последнее время. Первый вариант моей первой программы создавался четыре года — столько времени я потратил, чтобы ее написать. А первый вариант, как всем известно, наихудший, следовательно, его 1гужно улучшить. В этом и состоит сейчас моя задача.

Дорота. Твоя работа предполагает, что ты трудишься за компьютером один или в команде?

Януш. Зачастую проекты, которые я делаю, представляют собой фрагмент какого-то большого целого, но фрагмент выделенный и обособленный. Это работа командная не в том смысле, что один элемент лего пишут два человека. Каждый из нас пишет свой элемент лего, а целое складывается в одно большое лего. Разумеется, мы должны сотрудничать друг с другом, потому что то, что яв-

ляется выходными данными моей программы, является также входными данными для другой программы. Стало быть, я должен определить и подчинить свою программу определенному интерфейсу, чтобы эти два элемента соответствовали друг другу. Часто одна программа создается в Японии, вторая — в Англии, а третья — в Сан-Рамоне, в отделении нашей фирмы в Калифорнии. Это международная фирма, глобализованная, и, следовательно, каждый делает свой фрагмент, а потом мы складываем их в одну программу. И она должна работать, ведь это не университетские исследования, проводимые по принципу «может получится, может нет». В науке отрицательный результат — тоже результат. Когда я беседовал с создателем виагры, он сказал мне, что в его фирме работают двести химиков и биологов, но именно он синтезировал виагру, однако это вовсе не значит, что это его открытие. Да и вообще, виагра является европейским, а не американским открытием. Правда, «Пфайзер» — фирма американская, но исследования, открытие и патентование для нее проводились в Сэндвиче в Великобритании. Создатель виагры получил информацию от своих ста девяноста девяти коллег о том, что выбранные и исследованные ими пути были неверными. Но благодаря тому, что человек, открывший виагру, работал в концерне, ученые, не добившиеся результата по виагре, тем не менее имеют на нее такое же право, поскольку тоже принимали участие в ее открытии. Прошли времена Эдисонов. Теперь информации так много, что надо работать в команде.

Дорота. Поэтому ты сотрудничаешь с американскими и немецкими-специалистами по информатике?

Януш. Да, хотя моя фирма — это на самом деле голландское издательство. Называется оно «Эльсевиер» и в Польше известно главным образом тем, что издает научные журналы в области медицины и точных наук. С некоторого времени я занимаюсь также покупкой и пополнением баз данных — прежде всего Медлайн, медицинской