Литературная страничка



Записи дневника
03 июня 2009 года
МОЗГ. Основа интеллекта

     На протяжении, пожалуй, последних ста лет человечество постоянно решает задачу создание себе подобных существ. Это выражается в стремлении обезопасить достаточно ценные кадры от всевозможных рисков, связанных с выполнением особо опасных задач. Появлялись, к примеру, роботы-миноискатели... роботы-метеорологи... и огромное количество других специализаций. Но при производстве первых же экспериментальных образцов сразу выяснилась огромная проблема в воспроизводстве узлов машин, аналогичных человеческим. Легче смастерить робота, передвигающегося с помощью колес либо гусениц для повышенной проходимости, нежели воспроизвести устройство ноги.
    Но и в этой части роботостроения дело медленно, но начинает сдвигаться с мертвой точки, правда очень медленно (в самом прямом смысле этого слова – последние разработки японских ученых хоть и ходят сами похожим с человеком образом, но со средней скоростью не более 3-4 километров в час). Причины этого давно исследуются, прорабатываются и вполне возможно в скорости будут в ближайшие 10-15 лет исправляться.
    Совершенно противоположным образом обстоит дело в другой области жизнедеятельности человека – мыслительной. Человек испокон веков умеет мыслить, обдумывать, предлагать новое, исследовать, получая опыт. И, стоило только подойти в научно-техническом прогрессе к нужной точке развития, как многие умы синхронно стали биться над созданием искусственного аналога своего мозга. Но, что бы не получалось после различных этапов разработок, конечный продукт все больше и больше напоминал и напоминает машину с ее достоинствами, превосходящими все мыслимые возможности человека, и недостатками, нивелирующие достоинства.
    Конечно, есть большие успехи в разработке коллективных интеллектуальных стай, но об этом поговорим подробней в дальнейшем. А для начала разберемся, что же есть интеллект, как он устроен, и с чем его едят.
    «Интеллект (от лат. intellectus — понимание, познание) — общие способности к познанию, пониманию и разрешению проблем. Понятие интеллект объединяет все познавательные способности индивида: ощущение, восприятие, память, представление, мышление, воображение.» (1)
    «Под современным определением интеллекта понимается способность к осуществлению процесса познания и к эффективному решению проблем, в частности при овладении новым кругом жизненных задач. Поэтому уровень интеллекта возможно развить, как и повысить или понизить КПД интеллекта человека. Часто эту способность характеризуют по отношению к задачам, встречающимся в жизни человека. Например, по отношению к задаче выживания: выживание — основная задача человека, остальные для него — лишь вытекающие из основной, или к задачам в какой-либо области деятельности. Согласно академику Н. Н. Моисееву, интеллект — это, прежде всего, целеполагание, планирование ресурсов и построение стратегии достижения цели. Есть основания полагать, что зачатками интеллекта обладают животные, и уже на этом уровне их интеллект посредством механизмов целеполагания и достижения целей влиял и влияет на эволюцию животных...» (2)
    «Влияние интеллекта выходит за пределы жизни одного человека. Развитие интеллекта у homo sapiens выделило его из Animalia и стало началом развития социума, а затем и человеческой цивилизации. Согласно Валерии Прайд, интеллект человека определяет настоящую и будущую динамику эволюционного развития человека как вида...» (3)
    Общепринято мнение, что именно интеллект помог человеку выбиться наверх всей эволюционной системы, вполне возможно, сделав его венцом творения природы. Также всем с раннего детства известен факт, что любые мыслительные процессы протекают в головном мозге человека, где содержится миллиарды нервных клеток, ответственных за восприятие, запоминание, мышление. Как же происходит работа головного мозга?
    Головной мозг есть начало начал работы всего организма. Он ежесекундно анализирует сведения, собранные из тысяч различных источников. Им регулируются все биохимические процессы в организме. Но при этом, согласитесь, вам совершенно ни к чему знать постоянно, какой у вас пульс... Совершенно бессмысленно ежеминутно решать увеличивать или уменьшать количество адреналина в крови... И просто незачем решать вопросы регулирования притока крови в соответствие со свими двигательными нагрузками. Сам ваш мозг ограничил вас от этого. Иначе просто невозможно было бы существовать, живя только одними заботами о контроле своего организма.
    Совершенно аналогично и с данными, поступающими извне. Когда вы сидите и читаете книгу, рядом с вами могут обсуждать проблемы ваши родственники или сослуживцы; может работать телевизор или радио; за окном может петь музыка. Но вы совершенно отчетливо читаете книгу, практически абстрагируясь от всего этого. В данный момент огромный поток информации поступает посредством зрения и слуха. Мозг анализирует все это и отсеивает все вторичное, концентрируя все ваше сознание на той цели, которая поставлена заранее – чтение книги. И при этом миллионы нервных окончаний на коже посылают сигналы о состоянии внешней среды, тысячи нервных окончаний в желудке контролируют полный он или пустой, вызывая при случае ощущение голода. Причем даже голод вы не почувствуете сразу – чтобы резко не менять статус основного мыслительного процесса головной мозг будет тихо напоминать вам об этом между делом, постепенно увеличивая чувство голода. И уж ваше дело – пойти перекусить сейчас или же чуть позже.
    Но даже и тут все не просто. В обыкновенном чтении скрыто столько операций, которые ежесекундно проделывает наш мозг, что от одного этого может захватить дух.
    Во-первых необходимо сказать, что в нашей голове не откладываются буквы как таковые. Мы не запоминаем целые слова, чтобы в дальнейшем помнить, где именно они находятся в тексте. У нас это даже не врожденное. Это привитое. Все, что знает и умеет человек, он узнал. Узнал с помощью образов. Не зря нам в школе постепенно преподают всю азбуку. Мы одну за одной изучаем буквы. Мы создаем ассоциации на них.
    Человеческий мозг работает, как сложная электрическая сеть со своими связями. В голове есть набор нейронов. Они с собой либо соединены, либо просто находятся недалеко друг от друга. Каждый раз, когда мы узнаем что-либо новое, между этими двумя нейронами пробегает небольшой электрический сигнал. Этому сигналу очень сложно проложить новый путь. Совсем как альпинисту подняться впервые на гору. Стоит нам повторить, как между этими двумя нейронами пробегает следующий сигнал. На этот раз ему уже проще, ведь, путь уже известен, хоть и не освоен окончательно. И так, со временем, раз за разом в нашей голове окончательно и бесповоротно запоминается один факт.
    Абсолютно все, что мы видим, делаем, мы бессознательно для самого себя запоминаем. Вы зашли в квартиру и увидели обои. И этот факт у вас отложился в голове. Если вы пришли к другу всего лишь один раз, то вы вряд ли вспомните об их цвете и раскраске, если вас об этом спросят через неделю или даже месяц. Но если вы сами заселились в эту квартиру, то, видя обои чаще, вы и через полгода безошибочно назовете эти факты.
    Все, что мы видим, наш головной мозг тщательно анализирует. Это все начинается с рождения и заканчивается только со смертью. И связано это с самой практической нуждой – выживанием. Мы видим незнакомый нам еще предмет. И мы не знаем, как его можно применять или как он называется вообще. Но при этом за мгновение, как мы об этом узнали сознательно, на бессознательном уровне наш мозг сравнил все увиденные характеристики с тем, что хранится в его огромной базе. Он узнал, прямой это ли предмет, изогнутый... какого цвета он... приблизительная форма... В жизни крайне трудно найти две похожие друг на друга вещи. Но тем не менее, увидев дом, мы сможем безошибочно сказать, что это параллелепипед. Он не похож на простой математический параллелепипед, который нам показывали на уроках геометрии, но в общем виде... Мы не знаем, как называется новая модель автомобиля, но мы сразу же знаем, что это автомобиль. Наш мозг по основным узлам и деталям данного транспортного средства это выяснил и мгновенно передал нам об этом информацию. Он в один момент сравнил увиденный образ с миллиардами других и выбрал из наиболее похожего.
    Но если мы не знаем, что это за предмет, разве нам не интересно будет узнать, как он называется?
    Стоит ли после этого удивляться тому, что маленькие дети задают очень много вопросов? На них в какой-то момент просто-таки низвергается целый вулкан незнакомых образов, и им требуется какое-либо объяснение.
    Каждый факт откладывается в нашей голове! Абсолютно каждый! Просто некоторые связи между нейронами настолько слабы, что в дальнейшем мы просто не можем вспомнить этого. А вернее – тот небольшой мостик, что было наладился после первого знакомства с фактом, разрушается со временем за ненадобностью.
    Совершенно таким же образом у нас все происходит и с буквами. Мы с самого раннего детства видим эти образы. Мы постепенно можем отличить букву «а» от буквы «в». Наши связи, которые помнят образ буквы, постепенно налаживаются и упрочняются. И тут уже участвуют не два нейрона, и даже не сотня... и вполне возможно, что даже не тысяча. Мы в дальнейшем в жизни видим огромное количество разных почерков, разнообразных шрифтов. Но мы постепенно раз за разом воспринимаем их образ и узнаем буквы. И чем с большим количеством написаний букв мы сталкиваемся, тем легче нам в дальнейшем определить даже в самом отвратительнейшем почерке силуэт буквы. У нас накапливается вариативность.
    И тот почерк, которым мы пишем – это не только координация движений наших рук и пальцев. Это еще и в не последнюю очередь отображение образа буквы, которое хранится в нашем головном мозге.
    Так почему бы данный принцип не использовать при разработке искусственного интеллекта? Для начала разберемся с этим понятием. Что есть интеллект, мы уже выяснили. Что такое слова «естественный» и «искусственный» тоже, наверняка, каждый из нас знает. Естественный – это то, что существовало до человека и существовало бы и без его вмешательства. Это то, что дано нам природой. Наш с вами интеллект – вполне естественная вещь. А искусственный – это то, что творит сам человек. Проще говоря, ИИ – есть ни что иное, как попытка почувствовать себя творцом разума на земле. И в данной монографии я поставил задачу выяснение алгоритма отображения и написания искусственного интеллекта.
    Но, как мы помним, под интеллектом скрыты общие способности к пониманию, понятию, размышлению. Чтобы сказать, что машина обладает интеллектом, необходимо уверенно утверждать, что она думает, соображает, понимает. И тут стоит пояснить, что именно скрыто за этими словами, и как именно это понимают различные ученые.
    Первый, кто вообще сформулировал идею машинного интеллекта, а, значит, и задачу построения его, был английский ученый математик и кибернетик Алан Тьюринг. Сразу же после Второй мировой войны он напечатал в течение пяти лет ряд статей на эту тему. Он предполагал, что со временем электронные машины будут развиваться и достигнут к 2000 году того своего уровня, что смогут обладать настоящим интеллектом. Он же сформулировал и задачу, при решении которой на его взгляд можно было бы понять – обладает ли машина своим интеллектом или нет. Задача базируется на простом общении судьи с компьютером, проходящим тестирование, и одним человеком. Судья не знает, кто из двух его собеседников человек, и он должен наводящими вопросами определить это. Алан Тьюринг считал, что можно говорить о наличии интеллекта, если машина сможет обманывать судью в течение пяти минут.
    В последующие годы многие ученые подвергали сомнению этот вариант проверки наличия интеллекта. Все их доводы базируются на том, что при написании достаточно подробной программы и при учете достаточного количества особенностей языка можно заставить программу выдавать себя не только за человека, но даже за строго определенного человека, который обладает определенным характером и определенным набором знаний и умений.
    Противники этой теории считают, что искусственный интеллект уже состоит в том, что программист наделяет программный код строго определенным набором правил и действий, тем самым вкладывая в бездыханные цифры и буквы свой интеллект.
    Какая из этих точек зрения более правильна рассудит только время и каждый отдельный человек на этой планете для себя. Тем не менее в области совершенствования подобных разумных существ работают большое количество программистов и математиков; постоянно проводятся конкурсы между роботами на наиболее лучшего собеседника для человека. В сети Интернет появилось большое количество ботов, с которыми можно общаться достаточно продолжительное количество времени и даже не подозревать об общении с неживым существом. В первую очередь это связано с тем, что язык общения в Интернет-чатах не несет большой литературности. Он отрывочен. Часто некоторые словосочетания совершенно не связаны с предыдущим текстом и не несут никакой лексической и эмоциональной ценности.
    Но самый главный недостаток данного метода проверки состоит в том, что совершенно невозможно узнать и установить факт «осознавания программой своей работы». Можно предполагать все что угодно, но фактов нет и быть в данном случае не может. И все остальные слова из области философии и загадки про то, «что же было раньше – яйцо или курица»... Мы сталкиваемся с фактом, что программа отработана... мы понимаем, что над ней хорошо потрудился программист и даже группа программистов, написав добротный код... мы в конце концов понимаем, что база данных программы большая и самопополняема. Но практически любое действие программы можно предсказать. Потому что она запрограммирована... Она может выполнять только одну последовательность действий. И не может сбиться с алгоритма выполнения. Потому что так заранее определенно человеком.
    Но разве мы можем предположить, отчего наш ребенок ответил именно так, а не иначе? Мы, ведь, подчас удивляемся, что произносят дети. Это нормальный мыслительный процесс. Ребенок обдумывает полученную в виде вопроса информацию и выдает свое мнение по этому поводу.
    У программы своего мнения быть не может. У нее не заложено это в базе. Она никогда не сможет нас поразить чем-либо сверх-удивительным.
    И поэтому необходимо для проверки интеллекта машины ввести другой тест. Который проверит не наличие большой базы данных и умения подстраиваться под характер человека, используя в разговоре его же фразы, только немного переделанные и перестроенные. А тот, который проверит именно наличие мыслительных процессов... И этот тест нам всем хорошо известен. Мы сами не раз его проходили.
    Он называется ПЕРЕСКАЗ.
    Действительно, кто из нас не проходил в курсе средней общеобразовательной школы диктанты и пересказы с изложением? Нам давали какой-либо текст на уроке русского языка или литературы, и мы, прочитав его или прослушав, писали краткое его содержание. И теперь вопрос – а часто ли изложения у двух сидящих поодаль друг от друга учеников совпадали? Нет, понятно, что они прослеживали одну линию сюжета – по одному же рассказу проводилась проверка памяти и способности рассказать.
    Тогда почему бы не организовать подобные проверки знаний у машин, которые их создатели называют машинами, обладающими искуственным интеллектом? Предположим, во время тестирования выбирается совершенно любой отрывок из повести либо рассказ объемом около 5000 слов. Перед машиной стоит задача – в течение какого-либо промежутка времени написать текст, который бы отражал суть всего произведения, сюжетную линию и умещался бы в объеме, равном, к примеру 500 словам. То есть количеству, в десять раз меньшему. При этом совершенно недопустимо, чтобы в пересказанном тексте присутствовали подряд одним за одним словосочетанием три слова из исходного отрывка (рассказа). То есть отсекается возможность манипулирования отдельно взятыми из середины текста предложениями. После этого независимые судьи, среди которых в обязательном порядке присутствуют люди с филологическим или педагогическим образованием, оценивают литературность данного пересказа. Грамотность, как это делалось у нас в средних школах, оценивать не стоит – современные программные системы достаточно правильны в этой точке зрения. Насколько связанны друг с другом предыдущее и последующее предложения; насколько полно открыта картина сюжета; насколько... хотя нет... хватит хотя бы того, чтобы машина вообще произвела пересказ отрывка (рассказа), совершенно не опираясь на построение предложений в исходном тексте.
    Теперь вопрос состоит в следующем: можно ли будет судить о мыслительных процессах?
    Наиболее целенаправленную критику на тест Тьюринга сформулировал Джон Серль в своей теории, которая получила устоявшееся название как «Китайская комната». В ней он критикует возможность моделирования человеческого понимания естественного языка. Эксперимент Сёрль описывает в своей статье «Is the Brain’s Mind a Computer Program?» («Является ли мозговое мышление компьютерной программой?») следующим образом:
    «...Возьмём, например, какой-нибудь язык, которого вы не понимаете. Для меня таким языком является китайский. Текст, написанный по-китайски, я воспринимаю как набор бессмысленных каракулей. Теперь предположим, что меня поместили в комнату, в которой расставлены корзинки, полные китайских иероглифов. Предположим также, что мне дали учебник на английском языке, в котором приводятся правила сочетания символов китайского языка, причём правила эти можно применять, зная лишь форму символов, понимать значение символов совсем необязательно. Например, правила могут гласить: «Возьмите такой-то иероглиф из корзинки номер один и поместите его рядом с таким-то иероглифом из корзинки номер два».
    Представим себе, что находящиеся за дверью комнаты люди, понимающие китайский язык, передают в комнату наборы символов и что в ответ я манипулирую символами согласно правилам и передаю обратно другие наборы символов. В данном случае книга правил есть не что иное, как «компьютерная программа». Люди, написавшие её, — «программисты», а я играю роль «компьютера». Корзинки, наполненные символами, — это «база данных»; наборы символов, передаваемых в комнату, это «вопросы», а наборы, выходящие из комнаты, это «ответы».
    Предположим далее, что книга правил написана так, что мои «ответы» на «вопросы» не отличаются от ответов человека, свободно владеющего китайским языком. Например, люди, находящиеся снаружи, могут передать непонятные мне символы, означающие; «Какой цвет вам больше всего нравится?» В ответ, выполнив предписанные правилами манипуляции, я выдам символы, к сожалению, мне также непонятные и означающие, что мой любимый цвет синий, но мне также очень нравится зелёный. Таким образом, я выдержу тест Тьюринга на понимание китайского языка. Но все же на самом деле я не понимаю ни слова по-китайски. К тому же я никак не могу научиться этому языку в рассматриваемой системе, поскольку не существует никакого способа, с помощью которого я мог бы узнать смысл хотя бы одного символа. Подобно компьютеру, я манипулирую символами, но не могу придать им какого бы то ни было смысла...»
(4)
    Таким образом приводится один из примеров, когда даже достаточно полная и понятная речь для носителей языка сама по себе не является доказательством разумности и понимания лексики и семантики языка со стороны лица или электронного устройства, выполняющего эти действия. Но это в корне не применимо к самому определению пересказа. В частности, в словаре Ушакова приводится следующее определение:
    «ПЕРЕСКАЗА'ТЬ.
       1. Рассказать, изложить своими словами что-нибудь прочитанное или услышанное.
       2. Рассказать повторно, еще раз (разг.).
       3. Рассказать последовательно о чем-нибудь.
    «...Все видел, высмотрел; от удивленья, поверишь ли, не станет ни уменья пересказать тебе, ни сил. Крылов.»
    «...Просто вам перескажу преданья русского семейства, любви пленительные сны, да нравы нашей старины. Пушкин.»
    Таким образом, мы имеем полное право говорить о наличии в данном случае какого-либо понимания того, что произошло либо прочитано. Касательно человека, это происходит следующим образом:
       1) Человек получает какую-либо информацию. Не важно что это за информация и с помощью чего она получена. Это может быть зрительная, когда вы находитесь в какой-либо местности и смотрите на природу, людей, архитектуру и на многое-многое другое. Сюда же следует отнести и любую прочитанную информацию: книги, газеты, журналы, объявления. Также это может быть информация, полученная акустическим путем. Допустим, это прослушанная радио-передача или интересный художественный фильм, просмотренный по телевизору или на компьютере. Это может быть и информация, поступившая с помощью наших чувст – запахи, ощущения. Вам, к примеру, было очень тепло и хорошо на пляже.
       2) Вы анализируете и систематизируете полученную информацию. Вы никогда не сможете все запомнить настолько, что потом даже через год или второй воспроизвести ее по секундам, словно прочитав из базы данных или своего записного блокнота. Достаточно глупо было бы предположить, что человек после первого же прочтения книги потом будет помнить наизусть все диалоги и описания. Но при этом вы можете без проблем рассказать содержание и основной смысл понравившейся вам книги. Своими словами – так, как вы ее поняли. И в вашей речи не будет четких фраз, взятых из прочитанного текста. И в этом и состоит весь смысл работы головного мозга – совершенно не за чем держать в памяти громадные объемы текста. Для нормального вашего существования хватит обобщенной информации.
       3) Если в дальнейшем кто-либо из друзей или знакомых поинтересуется, насколько вам понравился фильм или рассказ, о чем там говорится и стоит ли его почитать или посмотреть, вы без труда расскажете основную сюжетную линию. Она будет предельно сжата – на основе анализа уже обобщенной информации. И ваш рассказ не будет таким же подробным, как весь художественный отрывок. Это и будет являться вашим пересказом данного текста.
    И можно после этого утверждать, что вы не обдумывали, не анализировали? Нет! Такого утверждать нельзя. Конечно, при письменном общении, когда своего собеседника не видно, можно просто переписать что-либо из огромного справочника и выдать за свои мысли по интересующему поводу. Но во время настоящей живой беседы ваш пересказ чего-либо всегда будет результатом мыслительной деятельности.
    Именно поэтому можно будет с уверенностью утверждать, что и компьютерная программа будет обладать зачатками интеллекта. Она сможет думать, если говорить проще.
    Но для окончательно поставленной задачи необходимо максимально точно сформулировать правила прохождения теста. Потому что недосказанность одного слова может впоследствие подчас обернуться немаловажными проблемами завтра.
    Итак.
    Первым требованием у нас будет наличие совершенно неизвестного заранее текста. Его объем можно определить в пять-шесть тысяч слов. Можно с уверенностью считать, что такого количества хватит для того, чтобы был полностью описан сюжет, пусть и небольшой, а также чтобы в тексте содержалось небольшое количество диалогов между различными людьми. Для чего это? Данный вид повествования, если можно так выразиться, сбивает общий сюжет, добавляет кусок чего-либо иного. А, следовательно, усложняет работу для анализа. И именно этим можно запутать следы, дабы усложнить, для искусственного интеллекта.
    Вторым условием назовем обязательную художественность выбранного фрагмента текста. Для чего? Просто именно в нем чаще всего все написано максимально доступным и красивым языком. И не будет каких-либо совершенно непонятных слов из новомодной лексики. А они не только могут ввести в заблуждение компьютер. В конце концов любой интеллект, будь он искусственный или самый настоящий, есть самообучающийся. Так зачем в этом случае намеренно «портить речь» будущему индивиду, коверкая его представление о речи? Можно сказать, что здесь мы говорим больше о моральных принципах. Хотя, и частичка технического тут тоже присутствует. Не без этого...
    Третьим условием, которое я уже выражал в статье, есть объем текста на выходе в виде пересказа не более, чем пять сотен слов. Лично мне кажется, что такого объема вполне хватит любому из нас, чтобы описать любой предмет, местность или книгу. Так почему мы должны утверждать, что аналогичного объема не хватит будущему машинному интеллекту? Вполне даже.
    Четвертым условием будет красота изложения. Нет, тут не стоит гнаться за тем, чтобы пересказ был похож на лучшие произведения классиков. Но тем не менее, он должен быть понятен простому обывателю. Не стоит делать пересказ, выдергивая по одному предложению из пяти. Тогда может получиться достаточно непонятный текст. К тому же это условие автоматически немного усложняет задачу для простых программистов, которые могут и, вполне возможно, что хотят выдавать свои программы (подчас очень даже сложные и «умные») за машинный разум.
    Пятое условие есть продолжение четвертого, но выглядит иначе и стоит обособленно. Оно будет заключаться в том, чтобы в предложении, которое будет приведено в тексте конечного пересказа не наблюдалось такой закономерности, как простая перестановка слов предложения. Ведь, можно взять целиком одно предложение, убрать какую-либо его часть, переставить слова в произвольном порядке и после всего этого выдать за собственную идею. Поэтому сразу четко оговариваем: в предложении, которое является конечным продуктом компьютера не может быть более четырех слов, которые в абсолютно любой последовательности встречаются в каком-либо предложении из исходного текста. Также это касается и однокоренных слов. Приведем такой пример:
    «Ранним летним деревенским утром озорное солнышко, просочившись между кудрявых веток березы за окном, поддразнивая, разбудило Ивана в его мягкой уютной постели».
    Что мы имеем? Мы имеем большое предложение. И в нем описано только лишь пробуждение парня по имени Иван. Пересказ можно начинать именно с него. Но начинать по-разному. Можно так:
    «Летом в деревне Ивана рано разбудило солнце, просочившись между веток березы за окном»
    а можно и вот так:
    «Когда в деревне настало утро, дневное светило ворвалось в спальную комнату Ивана и разбудило его»
    и еще один вариант:
    «Иван проснулся утром»
    Чем отличаются эти три предложения?
    Своим построением... и принципом, примененным при его озвучивании. Грубо говоря, в первом случае были просто переставлены слова, в некоторых местах они были заменены на однокоренные. К примеру, как «деревенским – деревне».Конечно, можно говорить о том, что часть текста ушла. Потому что она не сказана специально. И создается иллюзия пересказа. Но на самом деле его нет. Мы просто взяли и обработали данный текст по-другому.
    Во втором случае текст очень разнится от первоначального предложения. Но при этом легко заметить использование синонимов. Лично я убежден в том, что это не составит особого труда даже для простой лексической программы, в которой нет машинного разума (естественно, слово «простой» тут используется по сравнению с самим машинным интеллектом и нисколько не говорится, что для любого программиста написание такого будет проще пареной репы). Для читателя (одновременно являющегося судьей) предложение выглядит совершенно иным. Но по сути своей оно то же самое. Добавлены некоторые связки, вводные слова, изменены некоторые части речи на синонимы. И этим простой с некоторой точки зрения операцией мы создали иллюзию пересказа. Но на самом деле, согласитесь – разве нужно это для основного текста? Разве вы запоминали дословно при написании изложений, какое же именно дерево стояло за окном у Ивана? Грубо говоря это самое утро, эти самые ветки этого самого дерева вполне возможно, что даже больше никогда не появятся на страницах в дальнейшем. И, значит, они совершенно не интересны с точки зрения сюжета, а, следовательно, и пересказа. Этим можно только запутать судей. Создать в их голове красивую картинку, за которой более ничего нет. И именно поэтому необходимо введение условия, при котором бы не наблюдалось аналогичных ситуаций.
    Для пересказа просто сойдет, что «утром Иван проснулся». А все остальное только увеличивает эмоциональность изложения, которое принял для себя писатель. На данном этапе эмоциональность ни к чему. Нужно отличать основные объекты сюжетной линии от второстепенных.
    Итак, мы сформулировали пятое условие для конечного пересказа: любое его предложение не должно содержать четыре слова в любой последовательности любого предложения исходного текста, являться их синонимами либо однокоренными словами. Вот будет сформулировано предложение, в основу которого будет положено содержание четырех-пяти предложений. Эдакое сложно-составное. К примеру «проснувшись утром, Иван долго еще лежал в кровати, не желая вылазить из мягкой постели, меняя теплое одеяло на прохладу рассвета».
    Допустим, что автор это описал в нескольких предложениях. А машинный разум, проанализировав, свел все это в одно. Нас не интересует, каким было солнце, каким было дерево, какого цвета была кровать и даже место, где она стояла. Мы просто сказали основные действия, которые происходили с главным объектом повествования на протяжении нескольких предложений. А все выше перечисленное есть просто вторичные объекты, к которым в течение времени Иван имеет некоторое отношение.
    В этом и состоит суть интеллекта – анализ, выделение главного, создание общей картинки поведения основного объекта. Это и будет нашим пересказом.
    Шестым условием, конечно, мне бы хотелось еще ввести определенный временной потолок, в течение которого будет происходить эксперимент. В том же самом эксперименте, предложенном Аланом Тьюрингом времени отводилось пять минут. Но сегодня я прекрасно знаком с возможностями электроники. Поэтому заранее могу сказать, что происходить все будет достаточно быстро. Особенно, если машинный интеллект будет смоделирован по логичному и самому простому алгоритму. Ну, допустим, определим все это в одну минуту. Мне не жалко, а вам все равно.
    И, наконец, седьмым условием пускай будет присутствие не менее пяти независимых судей. И, чтобы это были, как минимум, люди, разбирающиеся в своей профессии. А точнее в таких науках: философии, лингвистике, филологии. Еще сюда добавим технического специалиста за слежением регламента и пониманием алгоритма на предмет анализа наличия машинного разума, а не простой случайной переборки слов. И подсластим все это пишущим человеком... писателем то есть.

    Мы поставили задачу научить компьютер думать, в частности - способность к анализу какого-то определенного сегмента текста, его восприятию и дальнейшему пересказу основной идеи, центрового стержня задумки автора. И теперь перед нами встала куда более сложная задача реализации. Действительно, каким образом можно научить компьютер анализу текста? Как научить его определять центр всей конструкции статьи? Если это художественная статья - как он может определить главного героя, как сможет отличить те события, которые с ним произошли? Если это какой-то технический текст - как понять машине без вмешательства человека что именно это за статья? Про какую часть естественной науки пишется?
    И самое главное - можно ли самому запрограммировать компьютер таким образом, чтобы он все это отличал? Можно, конечно можно. Можно создать потрясающий алгоритм, который будет работать. Но который будет каждый раз анализировать огромные данные, сравнивать их между собой, проходить многочисленные циклы и составлять миллионы условий в условных операторах. Естественно, кто-то обязательно это улучшит... чтобы быстрее выполнялось. И "движок" программы готов. Вуаля... В конце концов, наш с вами мозг работает примерно по аналогичному принципу. Он, ведь, сравнивает уже имеющиеся в нашей памяти данные с теми, что только-только поступают из внешних источников информации. А стоит ли овчинка выделки? Сколько потребуется бессонных ночей и какому по количеству программистов вообще? А сколько нужно будет проверять? Тот же самый упомянутый чуть выше мозг обладает куда большей производительностью, нежели даже самые современные средства высоких технологий.
    Но почему так? Отчего?
    Вы никогда не замечали, что, стоит вам только получить вопрос, как в вашей памяти сразу же всплывает какой-то объем информации по данной теме? Нет все отговорки и ужимки, вроде "сейчас-сейчас" или "можно минутку - я вспомню" никогда не действовали. Это просто обыкновенная тяга времени и молчаливые мольбы, что преподаватель сжалится и отпустит вас с нужной вам оценкой. Если вы что-либо знаете, вы практически всегда находили в своей памяти ниточку, по которой в дальнейшем и выходил весь ваш ответ. И при этом все происходило почти мгновенно... Вот вы в компании говорите с друзьями о женщинах, вспоминаете, какие у вас были отношения, тут же на ум пришли забавные истории из ваших похождений... но тут разговор каким-то образом перетек в русло компьютерных игр. И вы тут реагируете на этою Вы забываете то, что хотели сказать минуту назад. И уже совсем другие интересы. Но если кто-то опять заговорит о женщинах... Ей богу, прям и складывается такое ощущение, будто внутри у нас в центре огромной паутины сидит маленький паучок, который только при произнесении темы мгновенно отыскивает нужную паутинку и начинает по ней ползти. А переключиться? Да пожалуйста! И даже не стоит для этого возвращаться в центр паутины. Ведь, от паутинки с наименованием "игры" всегда проложен путь к паутинке "женщины". И вот вы снова на коне! И попутно при этом можете даже упомянуть о том, что женщины совершенно не умеют играть в игры. А, если и умеют, то только в свои - с куклами и скакалками...
    Кстати, вот это все немного напоминает своей конструкцией концепцию нейронных сетей. Правда, в достаточно усложненном виде. И этот самый вид мы оставим на чуть-чуть позже. А саму конструкцию нейронных сетей в том виде, какая она сейчас, и вовсе отдадим на откуп тем, кто решает задачи муравьиных троп и коммивояжера.
    почему?
    Да только потому, что они несовершенны. Они не лишают нас принудительного права перелопачивать огромные объемы данных, которые к искомой фразе поиска совершенно не относятся. В конце концов, такой пример. Вы читали всего Толстого Достоевского, Пушкина, Лермонтова, Есенина, Булгакова. Ограничим круг поиска только этим "небольшим" количеством. И зададимся вопросом, что быстрее будет: вы вспомните основной сюжет такого замечательнейшего романа, как "Кавказский пленник", или всего-навсего найдете ее у себя в электронной библиотеке с помощью "интеллектуальной системы поиска", чтобы освежить память воспоминаниями о сюжетной линии?
    Нет... Пожалуй, тут лучше следовать логике "лучше меньше, да лучше". И, чтобы понять, что же тут лучше, начнем с самого начала.
    Вы себя помните до трех лет?
    Нет... не нужно говорить вслух. Я прекрасно знаю о любимой привычке всех без исключения людей: говорить неправду. Но самому себе вы не врите уж.
    А знаете почему не сохранилось никаких воспоминаний об этом возрасте? Ответ один - они просто не нужны. Они совершенно не нужны. И это только из-за того, что, даже если бы все сохранилось, вы бы помнили не иначе как "что-то подошло"... "раздалось что-то"... "что-то трясется"... "а что это было"...
    Любой челове рождается абсолютно с нулевым багажом знаний. У него есть только основные инстинкты, которые нужны для того, чтобы организм жил и выживал. Но и их он не контролирует. Их выполняет мозг на неподсознательном уровне, чтобы не утруждать индивида... Помните, мы об этом говорили?
    Но при этом человек не выглядит совершенным дураком... Ребенок с первых же дней.... с первых же часов начинает впитывать в себя абсолютно все знания... абсолютно все, что видит, что слышит, что ему объясняют. И все это запоминается в качестве фундамента для будущей жизни. Именно в это время мы узнаем все основы. Поначалу мы издаем совершенно непонятные звуки. А потом постепенно начинаем подражать нашим родителям, говорить отдельные слоги и даже слова. Вот только голосовым связкам необходимы тоже развитие и адаптация, поэтому сначала даже эти наши первые попытки кажутся совершенно глупыми. И уж тем более мы не понимаем огромного количества тех слов, которые нам произносят. Но мы, ведь, учимся. К тому же нам в этом активнейшим образом помогают наши родители. Постепенно мы узнаем, что такое "красный", "мячик", "кукла", "погремушка". А еще нам много-много всего остального говорят. Со стороны эти попытки кажутся совершенно глупыми и никчемными, когда любящая мать постоянно во время игр с трех или четырехмесячным ребенком повторяет, что это пальчики, а это телевизор, а это - кровать... А ребенок только отвечает совершенно непонятными словами и странными для взрослого уха звуками.
    Но, ведь, это естественно. Грубо говоря, это то же самое, если вас вдруг взять и после средней школы сразу же послать в высокотехнологичное НИИ. Вы будете знать куда ходить, как включать свет. А большее... Посмотрим, в течение какого периода времени вы научитесь кое-как обращаться с установленном оборудованием. А все почему? Просто на вас одновременно обрушивается огромный объем информации, который вы поначалу просто не в силах понять и переварить. Так и ребенок. Он ничего не знает об этом мире, но всеми силами пытается узнать. И он узнает. И постепенно эти знания систематизируются и вы уже, повзрослев на пару лет, без проблем ими пользуетесь.
    Так зачем же вам помнить, как вы эти знания получили? Для чего вам это? Зачем для дальнейшей жизни вам помнить, что это квадрат, а вот это - круг? Оно вам не пригодится. Вы, ведь, и в дальнейшем не помните такие важные вехи своей жизни. Когда именно вы узнали, что это газовая плита, а рядом с ней белым шкафом виднеется холодильник. Главное другое - вы это узнали. И вы в дальнейшем будете этим пользоваться. И чем насыщенней и красочнее будет ваша предыдущая часть жизни, тем интереснее будет последующая.
    Но, в общем, мы отвлеклись немного. Оставим эту часть нашего сознания, как человека, психологам да детским врачам. Лучше сосредоточимся на другом - не на том, как мы получаем знания, а как именно мы их получаем.
    И опять же вернемся в детство. Что мы оттуда узнали? Цвета... Формы... Основные понятия предметов и явлений. А что лежит в основе предметов? А для этого попробуем проследить цепочку от конечной формы предмета к простейшим прототипам, из которых он состоит.
    Для этого возьмем очень сложный с этой точки зрения предмет, как автомобиль. Без всех его внутренностей. Вот. Просто на улице мы перед собой увидели автомобиль. Из чего он состоит? Первая часть будет состоять в "разборе" его на составные части. Кузов, колесо, окно, бампер... Нет, конечно, колес много... смотря какой именно автомобиль перед нами, но прототип колеса один. Точно также, как и окна. И мы имеем следующее разложение:

    Автомобиль:
      - бампер
      - колесо
      - кузов
      - окно

    Продолжим дальнейшее разложение каждого объекта на его составляющие. Возьмем колесо. Что мы можем сказать об автомобильном колесе? Оно круглое. Оно из резины. В самом центре его есть металлический диск. Вносим это все в нашу дискредитацию автомобиля на составные:

    Автомобиль
      - бампер
        - ...
      - колесо
        - круг
        - внешний обод - резиновый
        - внутренний - металлический диск
      - кузов
        - ...
      - окно
        - ...

    Абсолютно аналогично дальше можно раскладывать на составные части и все остальное. Мы будем этим заниматься, дабы не усложнять весь процесс. Продолжим с нашим колесом. В одном случае мы получили круг. Если вы думаете, что на этом все закончилось, то это большая ошибка. Круг - это линия. Прежде всего это линия. И, как каждая линия, она также имеет часть характеристик. Она может быть прерывной или непрерывной... кривой или прямой... А есть ли дальнейшая дискретность этих характеристик? Мне бы очень хотелось сказать, что есть... Но я совершенно ничего не смог придумать, поэтому говорю, что нет. Это конечные характеристики объекта.
    Если мы будем проделывать аналогичные операции по разложению на простейшие характеристики для внешнего резинового обода, то получим также характеристики в стиле: черное, круглое, определенной ширины/высоты/диаметра (кому, как нравится это называть). В любом случае это будет размерность, которая определяется в соответствующих единицах. Из круга мы опять получим уже вышеприведенные характеристики. А вот черный цвет будет конечным. Точно так же, как и размерность.
    И мы получаем следующее:

    Автомобиль
      - бампер
        - ...
      - колесо
        - круг
          - линия (контур)
            - непрерывная
            - кривая
          - внешний обод - резиновый
            - круг
              - линия
                - непрерывная
                - кривая
              - черный цвет
              - размер
              - ...
          - внутренний - металлический диск
      - кузов
        - ...
      - окно
        - ...

    Естественно, можно для каждого предмета придумать и огромное множество других характеристик, но в конце концов мы обязательно придем к такой характеристике, дальнейшее разложение которой на составные признаки не будет существовать. Только по той причине, что их просто нет. И эта характеристика будет конечной. И теперь скажите - а связана ли эта характеристика с первоначальным объектом? Мы имели автомобиль, получили "кривой", "непрерывный", "черный" и размер. Конечно, часть их можно адресовать к искомому объекту. Но многие не будут подходить. Не автомобили черные... и они уж точно не измеряются диаметром круга. И уж точно ни один из ваших собеседников не сможет догадаться по сказанным вами первичным признакам, что вы имеете в виду автомобиль.
    Но при этом обратное возможно...
    А отчего это? Это потому, что ко многим объектам можно применить одни и те же характеристики. Черные, непрервный, кривой... Что это? Галстук... утюг... да все, что угодно. В основе всего окружающего нас мира лежит не более двух-трех десятков первоначальных характеристик. И вот уже из их комплектации состоит все. В зависимости от присутствия определенного набора характеристик определяется объект. По наличию определенного набора характеристик и объектов определяется другой объект. И именно понятие этих самых первоначальных характеристик и формирование представления самых первоначальных объектов, с помощью которых можно описать все остальное, и занимает у нас первые месяцы и годы жизни.
    Вы же не станете утверждать, что помните колесо картинкой? Если бы вы помнили его только одной картинкой, то, увидев такое же колесо, но с другого ракурса, большего размера, другой окраски, вы бы сказали, что это "неколесо". А так, когда память об объекте "колесо" хранится в виде строго определенных простейших характеристик, при виде белого колеса или любого другого цвета вы просто добавляете в свою базу данных, что колесо может быть белым... А еще в колесе могут быть спицы или даже вместо диска звездочка, к которой крепится цепь, как на велосипедах, мопедах или даже мотоциклах.
    Огромное количество разнообразных колес... Представляете? Что, если их все сфотографировать и хранить в своей базе? Какой объем будет у нее? И как скоро вы поймете, что перед вами велосипедное колесо, а не автомобильное, анализируя картинки?... сравнивая их между собой... Получается, что это просто непрактично... У кого-то есть возражения по этому поводу?
    Мы постоянно, слой за слоем закладываем фундамент для того, чтобы иметь понимание о последующем уровне. Нельзя понять что-либо сложное без понятия тех объектов и характеристик, из которых состоит предмет. Так устроен человеческий мозг. И с этим не поспоришь... Хотите пример? Пожалуйста! Завоевание Америки испанскими конкистадорами. Многое... очень многое казалось индейцам волшебным. И это очень даже помогло завоевателям.
    И теперь зададимся простым вопросом. А можно ли скопировать данный вариант понимания окружающего мира и применить его при конструировании машинного или искусственного интеллекта? Мы, ведь, очень много при своих изобретениях берем идеи у природы, как из величайшей кладовой, коей она и является. Так отчего же воспользоваться и такой великолепнейшей интерпретацией конечного ответа по созданию интеллекта? Зачем копить огромные базы данных, усовершенствовать поиск по ним и увеличивать производительность? Может, просто стоит изменить концепцию хранения и понимания?
    Естественно, сразу же у нас возникнет вопрос следующего плана: "Для чего именно это нам?" Конечно, человеческий мозг не совершенен... мы не умеем пользоваться всем тем, что запоминаем. И поэтому данный способ восприятия в корне имеет минус в том, что часть информации намеренно отбрасывается. За ненадобностью. Чтобы избежать переполнения банка данных. Но при этом сразу стоит отметить, что этот минус можно легко нивелировать лишь тем соображением, что мы не можем наперед сказать, что же нас ждет после реализации.
    Кроме того, Можно наперед сказать, для чего это нам необходимо при разработке концепции искусственного интеллекта. Мы основываемся на том, что компьютер должен думать. И как основу, по которой можно будет утверждать об этом, взяли понимание текста и его пересказ. А теперь представим, что компьютер знает основные объекты нашего материального мира. Он знает, кто и что такое человек, из чего он состоит, какие у него характеристики. И за простым предложением в тексте "Иван проснулся" будет не просто содержание двух слов, одно из которых - имя собственное, а другое - глагол. Для компьютера это уже будет объект, состоящий из каких-либо других объектов. И, если понадобится, компьютер сможет вывести все примерные характеристики человека. И этот объект в тексте не просто что-то сделал. Рядом с ним не просто так написан какой-то глагол. Этот объект проснулся. А сон - это одна из характеристик человека. Сложных характеристик, которые сами по себе описывают огромный пласт материального мира. И, если мы видим в слове "проснулся" корень слова "сон" и автоматически понимаем, что это глагол, а, значит, происходит действие, которое связано со сном, то и машинный разум это легко поймет. Образованный машинный разум.
    И все дальнейшие события в тексте компьютер будет понимать как взаимодействие объектов. Как определенную цепочку действий. И что тогда? Разве после всего этого может встать проблема в пересказе основной идеи текста? Мы знаем, что один объект проснулся... затем пошли другие действия... к примеру, какие-либо диалоги. В конце концов можно будет поговорить и о сути рассказа. Это будет достаточно просто. Гораздо сложнее другое - смочь сделать это.
    А, следовательно, не откладывая дело в долгий ящик, начинаем работы по реализации данной задачи. Еще не практически, а только подводя теоретическую базу.

    Прежде всего стоит определиться с тем, как именно мы это будем реализовывать. В общем, в деталях мы в этом уже немного разобрались. У нас будет паутина. Паутина знаний, где каждая дальнейшая паутинка будет более сложным объектом, состоящим из предыдущих.

          2009.06.03