Разработка системы машинного кодирования, помимо технической реализации алгоритмов извлечения данных, представляет собой, прежде всего, инженерию знаний, на основе которых будут извлекаться события. Чаще всего эти знания представляют собой набор словарей слов, словосочетаний и правил извлечения, но в случае машинного обучения это могут быть также специально подготовленные текстовые корпуса, из которых правила для извлечения информации выделяются автоматически.
Преимуществом машинного кодирования является неподверженность таким человеческим факторам, как субъективность и усталость, и возможность закодировать за время от нескольких минут до нескольких часов объем данных, на который потребовалось бы несколько лет при ручном кодировании.
Среди недостатков машинного кодирования, по сравнению с ручным, можно назвать то, что, во-первых, машину трудно научить понимать смысл сложных языковых конструкций и различных метафор, во-вторых, машине сложно действовать в ситуациях, когда интерпретация события требует значительного информационного бэкграунда, либо требуемая информация неявно выражена в тексте. Трудности применения машинного кодирования возникают при использовании сложных схем классификации, включающих большое количество контекстной информации. Кроме того, сам процесс разработки системы кодирования может потребовать довольно много времени и навыков.
Тем не менее, в ряде случаев машинное кодирование незаменимо: с его помощью можно обрабатывать большие текстовые массивы, проанализировать которые без использования автоматизации часто не представляется возможным».
3. «Методы исследования.
1). Дискурс-анализ. Он заключается в том, что каждый источник исследуется в рамках дискурса, то есть контекста его появления. Выясняется, кто, почему и зачем создал тот или иной текст, как на его содержание повлияла общественно-политическая среда. Это позволяет отделить объективную информацию от субъективных и конъюнктурных наслоений.
2). Ивент-анализ. Массив изучаемых событий разлагается на составные части. Для каждого события выделяются активный участник, объект воздействия, цель активного участника, инструменты достижения цели, бенефициар, результаты для активного участника, объекта воздействия и бенефициара. Полученные данные заносятся в таблицу, дальнейшая сортировка которой по различным параметрам даёт возможность понять, кто наиболее часто является активным участником событий в изучаемом процессе, кто — объектом воздействия, кто — бенефициаром, выявить корреляцию между целями, инструментами их достижения и результатами.
3). Сравнительный анализ. Он предполагает разложение двух или нескольких сложных объектов на сравнимые составные части (например, во внешнеполитической деятельности двух или нескольких государств могут быть выделены следующие составляющие: программные документы, органы, финансирование, проведённые программы и мероприятия и т.д.). Далее составные части сравниваются друг с другом по заранее определённым критериям (например, количественному: объём документа, количество задействованного персонала, количество потраченных денег, количество откликов в СМИ на проведённые программы и мероприятия и т.д.) На основе сравнения составных частей делается вывод об общих и особенных чертах объектов в целом.
4). Институциональный анализ. Для изучаемого международного процесса выявляются задействованные в нём институты (организации). Изучаются уставные документы организаций, выявляются цели и задачи их деятельности. Изучаются программы и мероприятия организаций, оценивается их эффективность в решении задач и достижении целей. В итоге изучаемый процесс систематизируется: выявляются аспекты, входящие в «компетенцию» различных институтов, аспекты, не затронутые институционализацией, и проблемные аспекты, недостаточно эффективно управляемые при нынешнем уровне институционализации процесса».
Неудачные
1. «Для проведения исследования использовалась следующие методы:
1. контент-анализ,
2. сравнительный анализ».
Комментарий научного руководителя.
«Строго говоря, согласно формальным требованиям к курсовым работам, простого перечисления методов вполне достаточно. Однако лучше будет разъяснить хотя бы в одно-двух предложениях, в чём заключается каждый из этих методов и как конкретно они применяются в работе».
2. «Методы исследования — аналитический, сравнительный, исторический, логический, системный анализ, институциональный анализ».
Комментарий научного руководителя.
«Любые методы научного исследования являются логическими, так как основаны на принципах логики. Даже наблюдение своим результатом имеет фиксирование неких понятий, суждений, выработку умозаключений — то есть логические действия. Поэтому слово «логический» в Вашем списке кажется лишним.
Слово «аналитический» также лишнее, поскольку включение системного и институционального анализа в список методов уже указывает на то, что аналитический метод был Вами использован. Повторяться не нужно».