Текстологические методы
С извлечением знаний из текстов мы сталкиваемся ежедневно. Этот способ обычно всегда предшествует коммуникативным методам, подготавливая инженера по знаниям и знакомя его с терминологией и основными идеями.
Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей и других носителей профессиональных знаний.
Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре (то есть смысловой структуре текста).
Рассмотрим этапы одной из возможных методик анализа текстов с целью извлечения и структурирования знаний.
1. Составление «базового» списка литературы для ознакомления с предметной областью и чтение литературы по списку.
2. Первое знакомство с текстом (беглое прочтение) с выписыванием незнакомых слов.
3. Консультации со специалистами или привлечение справочной литературы для их понимания.
4. Внимательное (второе) прочтение текста с выписыванием наборов ключевых слов (НКС), т. е. выделение «смысловых вех» (компрессия текста).
5. Определение связей между НКС, разработка семантической структуры текста в форме графа или «сжатого» реферата (здесь фактически происходит формирование поля знаний).
6. Третье прочтение текста и коррекция поля знаний при необходимости.
Коммуникативные методы
Определение:
Пассивные методы извлечения знаний включают методы, где ведущая роль в процессе извлечения знаний передается эксперту, а инженер по знаниям только фиксирует его рассуждения, используемые во время работы по принятию решений.
Согласно классификации к этой группе относятся:
Ø наблюдения;
Ø анализ протоколов «мыслей вслух»;
Ø лекции.
Наблюдения
В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения знаний эксперту необходимо объяснить цель наблюдений и попросить эксперта максимально комментировать свои действия.
Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Полезной может оказаться и видеозапись в реальном масштабе времени, если эксперт согласится. Непременное условие этого метода — невмешательство аналитика в работу эксперта.
Методы психолого-педагогического исследования; Теоретические методы исследования
... исследования, степенью общности поставленных задач, накопленным опытом, уровнем развития научного знания и т.д. Методы, подходящие для одной области научных исследований, оказываются непригодными для ... приборов; отражающие результаты деятельности и т. п. Результат применения теоретических методов представлен знанием о предмете в форме естественно-языковой, знаково-символической или пространственно- ...
Существуют две основные разновидности проведения наблюдений:
Ø наблюдение за реальным процессом;
Ø наблюдение за имитацией процесса.
Обычно используются обе разновидности. Сначала инженеру по знаниям полезно наблюдать за реальным процессом, чтобы глубже понять предметную область и отметить все внешние особенности процесса принятия решения.
Наблюдение за имитацией процесса проводят обычно также за рабочим местом эксперта, но сам процесс деятельности запускается специально для аналитика.
Наблюдения за имитацией проводят также и в тех случаях, когда наблюдения за реальным процессом по каким-либо причинам невозможны (например, профессиональная этика врача-психиатра может не допускать присутствия постороннего на приеме).
Наблюдения — один из наиболее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.
Анализ протоколов «мыслей вслух»
Протоколирование «мыслей вслух», или «вербальные отчеты», отличаются от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т. е. продемонстрировать всю цепочку своих рассуждений. Во время рассуждений эксперта все его слова, весь «поток сознания» протоколируется инженером по знаниям, при этом полезно отметить даже паузы и междометия.
Вопрос об использовании для этой цели диктофонов является дискуссионным, поскольку диктофон иногда парализующе действует на эксперта, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.
Основной трудностью при протоколировании «мыслей вслух» является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, знания типа «как завязывать шнурки»), вообще слабо коррелируют с их словесным описанием.
Расшифровка полученных протоколов производится инженером по знаниям самостоятельно, с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование «мыслей вслух» является одним из наиболее эффективных методов извлечения знаний.
От инженера по знаниям метод «мысли вслух» требует тех же умений, что и метод наблюдений. Обычно «мысли вслух» дополняются потом одним из активных методов для реализации обратной связи между интерпретацией инженера по знаниям и представлениями эксперта.
Лекции
Лекция является самым старым способом передачи знаний.
В лекции эксперту предоставлено много степеней свободы для самовыражения; при этом необходимо сформулировать эксперту тему и задачу лекции.
Опытный лектор может заранее структурировать свои знания и ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце задать необходимые вопросы.
Наиболее типовые ошибки начинающих Слушателей online-лекций
... опираясь на Ваш конспект. 2. Для точной навигации по вопросам / темам лекции используйте содержание записи лекции по времени. 3. Чтобы на YouTube открыть содержание всей ... материала: - перечитайте конспект ещё раз, отметьте наиболее важные (!) моменты; - напишите список вопросов, мыслей по лекции, чтобы проработать их на неделе. 2. На титульном / первом листе ...
Искусство написания конспекта лекции заключается в «помехоустойчивости». То есть это умение записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.
Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет инженера по знаниям в глазах эксперта.
Опытный лектор знает, что все вопросы можно условно разбить на три группы:
Ø умные вопросы, углубляющие лекцию;
Ø глупые вопросы или вопросы не по существу;
Ø провокационные вопросы.
Если инженер по знаниям задает вопросы второго типа, то возможны две реакции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же инженер по знаниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.
Продолжительность лекции рекомендуется стандартная — от 80 до 100 минут с перерывом 5—10 минут в середине лекции. Курс обычно от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.
Активные индивидуальные методы
Активные индивидуальные методы извлечения знаний на сегодняшний день — наиболее распространенные. В той или иной степени к ним прибегают при разработке практически любой ЭС.
К основным активным методам можно отнести:
· анкетирование;
· интервью;
· свободный диалог.
Во всех этих методах активную функцию выполняет инженер по знаниям, который пишет сценарий и режиссирует сеансы извлечения знаний.
Анкетирование
Анкетирование представляет собой самый жесткий метод, т. е. наиболее стандартизированный. В этом случае инженер по знаниям заранее составляет вопросник или анкету и использует для опроса нескольких экспертов. В этом состоит основное преимущество анкетирования.
Сама процедура может проводиться двумя способами:
Ø аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта;
Ø эксперт самостоятельно заполняет анкету после предварительного инструктирования.
При использовании второго способа у эксперта появляется неограниченное время на обдумывание ответов, что может являться преимуществом в некоторых ситуациях.
Разработка анкеты для применения данного метода является важнейшим элементом, определяющим эффективность извлечения знаний. Для успешного проведения анкетирования разработано несколько общих рекомендаций для составления анкет. Эти рекомендации являются универсальными, т. е. не зависят от предметной области.
Инженерам по знаниям рекомендуется пользоваться этими рекомендациями для повышения эффективности применения данного метода.
150 вопросов с ответами по Философии
... об объекте, получаемая посредством чувственного или интеллектуального его постижения. - результативности наших знаний. Вопрос 35. Сознание – это: - общественный продукт. - естественный процесс структурирования материи. ... познавательных средств – общих понятий. - все перечисленное. Вопрос 40. Антропология – это: - часть философского знания, исследующая природу и сущность человека. - часть философии, ...
Интервью
Под интервью понимается специфическая форма общения инженера по знаниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области. Наибольший опыт в проведении интервью накоплен в журналистике и социологии. Большинство специалистов этих областей отмечают, тем не менее, крайнюю недостаточность теоретических исследований по тематике интервьюирования.
Интервью очень близко тому способу анкетирования, когда аналитик сам заполняет анкету, занося туда ответы эксперта. Основное отличие интервью в том, что оно позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию общения.
Свободный диалог
Свободный диалог – это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в котором нет жесткого регламентированного плана и вопросника.
Это определение не означает, что к свободному диалогу не надо готовиться. Напротив, внешне свободная и легкая форма этого метода требует высочайшей профессиональной и психологической подготовки.
Так, в одном из исследований по технике ведения профессиональных журналистских диалогов было экспериментально доказано, что одобрительное и поощрительное «хмыканье» интервьюера увеличивает длину ответов респондента.
В свободном диалоге важно также выбрать правильный темп или ритм беседы: без больших пауз, т. к. эксперт может отвлечься, но и без гонки, иначе быстро утомляются оба участника, и нарастает напряженность, кроме того, некоторые люди говорят и думают очень медленно. Умение чередовать разные темпы, напряжение и разрядку в беседе существенно влияет на результат.
Подготовка к диалогу так же, как и к другим активным методам извлечения знаний, включает составление плана для проведения сеанса извлечения знаний.
Активные групповые методы
К групповым методам извлечения знаний относятся:
Ø экспертные игры;
Ø дискуссии за «круглым столом» с участием нескольких экспертов;
Ø «мозговые штурмы».
Основное достоинство групповых методов — это возможность одновременного получения знаний от нескольких экспертов, взаимодействие которых вносит в этот процесс элемент принципиальной новизны от наложения разных взглядов и позиций.
«Круглый стол»
Метод «круглого стола» предусматривает обсуждение какой-либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Обычно вначале участники высказываются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии колеблется от трех до пяти — семи.
От инженера по знаниям подготовка «круглого стола» потребует дополнительных усилий: как организационных (определение места, времени, обстановки и т. д.), так и психологических (умение вставлять уместные реплики, чувство юмора, память на имена, способность избегать конфликтные ситуации и т. д.).
Ход беседы за круглым столом удобно записывать на диктофон, а при расшифровке и анализе результатов учитывать этот эффект, а также взаимные отношения участников.
Задача дискуссии — коллективно, с разных точек зрения, под различными углами исследовать спорные гипотезы предметной области. Обычно эмпирические области богаты таким дискуссионным материалом. На «круглый стол» обычно приглашают представителей разных научных направлений и разных поколений, это также уменьшает опасность получения односторонних однобоких знаний.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменили тему обсуждения, и чтобы критика позиций друг друга была обоснованной.
«Мозговой штурм»
«Мозговой штурм» или «мозговая атака» — один из наиболее распространенных методов раскрепощения и активизации творческого мышления.
Впервые этот метод был использован в 1939 г. в США как способ получения новых идей в условиях запрещения критики.
Замечено, что боязнь критики мешает творческому мышлению, поэтому основная идея штурма — это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.
Как правило, штурм длится недолго (около 40 минут).
Участникам (до 10 человек) предлагается высказывать любые идеи (шутливые, фантастические, ошибочные) на заданную тему. Обычно высказывается более 50 идей.
Регламент – до 2 минут на выступление. Самый интересный момент штурма — это наступление пика, когда происходит непроизвольная генерация гипотез участниками. Этот пик имеет теоретическое обоснование в работах выдающегося швейцарского психолога и психиатра 3. Фрейда о бессознательном.
При последующем анализе всего лишь 10—15% идей оказываются разумными, но среди них бывают весьма оригинальные. Оценивает результаты обычно группа экспертов, не участвовавшая в генерации.
Ведущий «мозгового штурма» — инженер по знаниям — должен свободно владеть аудиторией, подобрать активную группу экспертов — «генераторов», не блокировать плохие идеи, так как они могут служить катализаторами хороших. Искусство ведущего — это искусство задавать вопросы аудитории, стимулируя генерацию новых идей.
Основной девиз штурма — «чем больше идей, тем лучше». Фиксация хода сеанса — традиционная (составление протокола или с помощью диктофона).
Экспертные игры
Понятие экспертной игры или игры с экспертами в целях извлечения знаний восходит к трем источникам — это:
— деловые игры, широко используемые при подготовке специалистов и моделировании;
— диагностические игры;
— компьютерные игры, все чаще применяемые в обучении.
В настоящее время в психолого-педагогических науках нет развитой теоретической концепции деловых игр и других игровых методов обучения. Тем не менее на практике эти игры широко используются. Под деловой игрой чаще всего понимают эксперимент, где участникам предлагается производственная ситуация, а они на основе своего жизненного опыта, своих общих и специальных знаний и представлений принимают решения.
Решения анализируются, и вскрываются закономерности мышления участников эксперимента. Именно эта анализирующая часть деловой игры полезна для получения знаний. И если участниками такой игры становятся эксперты, то игра из деловой превращается в экспертную. Из трех основных типов деловых игр (учебных, планово-производственных и исследовательских) к экспертам ближе всего исследовательские, которые используются для анализа систем, проверки правил принятия решений.
Диагностическая игра — эта та же деловая игра, но применяемая конкретно для диагностики методов принятия решения в медицине. Эти игры возникли при исследовании способов передачи знаний от опытных врачей новичкам.
Плодотворность моделирования реальных ситуаций в играх подтверждается сегодня практически во всех областях науки и техники. Они развивают логическое мышление, умение быстро принимать решения, вызывают интерес у экспертов.
Идея использовать компьютеры в деловых играх известна давно. В настоящее время, когда компьютерные игры взяли в плен практически всех пользователей персональных ЭВМ, стала очевидной особая притягательность такого рода игр.
Игры иногда полезны для развлечения экспертов перед сеансом извлечения знаний. Кроме того, очевидно, что экспертные игры могут успешно применяться для непосредственного извлечения знаний. Однако разработка и программная реализация такой игры потребуют существенных вложений временных и денежных ресурсов.
Вкратце охарактеризуем основные косвенные коммуникативные методы извлечения знаний.
Многомерное шкалирование — метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым объектам, в пространстве меньшей размерности чем пространство признаков объектов.
Иерархическая кластеризация — один из методов упорядочивания данных, визуализация которых обеспечивается с помощью графов.
Кластерный анализ — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о некоторой выборке объектов, и затем объединяющая объекты в сравнительно однородные группы.
Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных.
Анализ репертуарных решеток — методика исследования индивидуальной категориальной структуры личности, предложенная в 1950-х американским психологом Джорджем А. Келли (1905-1967) для изучения того, как человек воспринимает, интерпретирует, оценивает и прогнозирует свой жизненный опыт и окружающий мир.
Анализ РР используется в различных областях практической деятельности: психологии и психодиагностике, психиатрии, социологии, педагогике, рекламе, дизайне, политике, менеджменте, профконсультировании, лингвистике, истории, риторике и т.д.
Анализ РР позволяет выявлять значимые для специалиста признаки (конструкты), определять силу и направленность связей между ними и строить из них связную систему.
Далее перейдем к рассмотрению моделей приобретения знаний. Процесс приобретения знаний можно разбить на следующие задачи:
Связь данных и знаний
Данные — это информация, полученная в результате наблюдений или измерений отдельных свойств, характеризующих объекты, процессы и явления предметной области.
n данные как результат измерений и наблюдений;
n данные на материальных носителях информации (таблицы, справочники);
n структуры данных в виде диаграмм, графиков;
n данные в компьютере на языке описания данных;
n базы данных на машинных носителях информации.
Знания — это выявленные в результате практической деятельности и профессионального опыта закономерности предметной области.
n знания в памяти человека как результат обучения, воспитания, мышления;
n знания на материальных носителях (инструкции, учебники, методические пособия);
n поле знаний (условное описание основных объектов предметной области, их атрибутов и закономерностей);
n знания, описанные на языках представления знаний;
n база знаний на машинных носителях информации.
В настоящее время декларативные языки программирования часто называют языками ИИ. Это происходит потому, что в декларативной программе не предписывается выполнения определенной последовательности действий, а лишь дается разрешение их совершать. Вследствие этого, программа сама находит некоторый способ достижения поставленной цели, причем часто таких способов может быть несколько.
В рамках наук об ИИ существуют десятки способов представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:
· продукционные модели
· семантические сети
· фреймы
· формальные логические модели.
На практике редко удаётся обойтись рамками одной модели при разработке ИИС, поэтому представление знаний получается сложным.
Перейдем к рассмотрению общей классификации моделей представления знаний.
Следует сразу сказать, что модели представления знаний в литературе часто смешивают с методами представления знаний, то есть используются два разных названия для характеристики одного и того же элемента.
Для представления глубинных знаний |
Для представления поверхностных знаний |
К формально-логическим моделям относят классическую теорию исчисления предикатов 1-го порядка. Чаще всего эти логические модели строятся при помощи декларативных языков логического программирования, наиболее известным представителем которых является язык Пролог (Prolog).
Начало истории языка относится к 70-м годам XX века. Интерес к Прологу поднимался и затихал несколько раз, энтузиазм сменялся жестким неприятием. Наибольшее внимание Пролог привлек к себе как к языку будущего во время разработок японской национальной программы «Компьютеры пятого поколения» в 1980-х годах, когда разработчики надеялись, что с помощью Пролога можно будет сформулировать новые принципы, которые приведут к созданию компьютеров более высокого уровня интеллекта. Неправильная оценка этой перспективы явилась одной из причин неудачи проекта.
В настоящее время Пролог, несмотря на неоднократные пессимистические прогнозы, продолжает развиваться в разных странах и вбирает в себя новые технологии и концепции, а также парадигмы императивного программирования.
Рассмотрим еще одну классификацию моделей представления знаний в виде таблицы. В первоисточнике эта таблица названа как Методы представления знаний.
Далее по ходу лекций мы подробно разберем все явные методы представления знаний и частично затронем неявные методы представления знаний.
Разработка первых систем ИИ начиналась со становления формальных языков представления знаний, к которым относятся исчисление высказываний и предикатов. Основная идея этого подхода – сохранение истинности операций на корректно построенных выражениях.
Так происходило развитие явных методов представления знаний: от теории исчисления высказываний к развитию ассоционистских теорий смысла.
Далее остановимся более подробно на теориях исчисления высказываний и предикатов.