Меню Содержимое
Главная arrow Заметки arrow Разработка анкеты с использованием queXML и LimeSurvey

Реклама


Разработка анкеты с использованием queXML и LimeSurvey PDF Печать E-mail
Автор Александр Матрунич   
22.08.2008 г.
В публикации идет речь об усовершенствовании процесса подготовки документов при проведении социологического исследования. Для этих улучшений в работе предлагается использовать XML-стандарт описания документов и ряд свободных программ. Данная статья фокусируется на этапе разработки анкеты и его связи с этапом подготовки шаблона массива данных.
Статья находится в состоянии разработки. Комментарии и вопросы приветствуются.

Проблема: документы исследовательского проекта создаются по отдельности

Обычный процесс проведения социологического проекта с применением статистических методов ("количественные исследования") включает в себя такие шаги:

  1. Исследовательская идея начинает формулироваться в тексте программы.

  2. Чтобы подготовить анкету, необходимо выделить наблюдаемые переменные, которые формируются в виде вопросов.

  3. Исходя из анкеты создается шаблон массива данных.

  4. После сбора данных производится статанализ.

  5. На основе результатов пишется исследовательский отчет.

Все эти шаги сопровождаются подготовкой ряда текстовых документов. Сюда входят программа исследования, анкета (или документ для регистрации наблюдений, дневник и т.п.), отчет. Помимо текстовых документов для статобработки составляется шаблон массива данных. Обычно он создается в редакторе электронных таблиц или в специализированной программе типа SPSS.

Все эти документы логически взаимосвязаны: программа исследования несет в себе информацию о содержимом анкеты. Анкета несет в себе большую часть информации о структуре массива данных. Результаты, получаемые при обработке массива данных, используются в отчете.

Применяя распространенные средства обработки текстов и электронных таблиц, исследователь вынужден вручную переносить необходимые данные из одного документа в другой, самостоятельно поддерживать совместимость структур анкеты и массива данных, копировать результаты статистической обработки в текстовый документ и т.д.

Специализированные программы для проведения предлагают инструменты для решения подобных задач. Например, в пакете SPSS существует приложение Data Entry. Программа SPSS и модули к ней - это отличный инструментарий для исследователя, но существует ряд ограничений при его использовании. Во-первых, все компоненты SPSS платные, с ценами на них можно ознакомиться на официальном сайте SPSS. Во-вторых, все компоненты SPSS поставляются с закрытым исходным кодом, поэтому мы не можем проверить, как, например, программой SPSS высчитываются те или иные статистики. По сути дела, мы вкладываем в SPSS наши данные, как в черный ящик, и на выходе из этого черного ящика получаем некие, похожие на правду, показатели. Это ведет к тому, что ученые не имеют права использовать SPSS в научных исследованиях, поскольку то, что происходит внутри закрытой программы, невозможно проверить. И в-третьих, далеко не все компоненты SPSS могут запускаться в операционных системах, отличных от Windows. Например, тот же самый SPSS Data Entry работает только под Windows.

Вопрос заключается в том, что существуют ли открытые, бесплатные и кроссплатформенные аналоги программ, поддерживающие процесс социологического или маркетингового исследования на всем его протяжении от написания программы до подготовки отчета.

Постановка задачи

Схема по поддержке процесса "создание анкеты - опрос - анализ данных":

Этап исследования

Реализация этапа на компьютере

 1

Формирование схемы анкеты

Схема анкеты создается в LimeSurvey

 2

Схема анкеты преобразуется в нужную физическую форму: для самозаполнения, для личного интервью, для Интернет-опроса, для телефонного опроса.

Для твердых (бумажных) копий схема анкеты преобразуется в pdf-макет для печати (queXML -> FOP), для электронных (Интернет и телефон) анкета заполняется прямо в LimeSurvey.

 3

Данные опроса вводятся в базу данных.

С бумажных копий анкеты данные вводятся в LimeSurvey. При электронной форме опроса данные уже введены.

 4

Статистическая обработка данных.

Базовая обработка происходит прямо в LimeSurvey.  Для более глубокого анализа даные могут быть экспортированы в CSV-файл для работы в редакторе электронных таблиц (OpenOffice.org Calc, Microsoft Excel) или в программе для статанализа (R, SPSS, Statistica).

Назначение программы LimeSurvey



LimeSurvey позволяет создавать анкеты с вопросами разных типов, публиковать анкеты на вэб-сервере в Интернете или локальной сети, проводить оповещение респондентов через электронную почту, подсчитывать базовую статистику по ответам, экспортировать данные с ответами в программы статистической обработки.

Существуют возможности создавать профессионально выглядящие печатные версии анкет, созданных в LimeSurvey, а также распознавать заполненные бумажные анкеты с использованием сканера. Для этих задач в связке с LimeSurvey используйте queXML.

Одной из важных особенностей LimeSurvey является то, что данная программа распространяется на условиях публичного договора General Public License. Это дает пользователю гарантию в том, что никто не потребует оплаты за использование LimeSurvey.

Вторым важным аспектом LimeSurvey является минимальный уровень требований к компьютеру респондента. От него требуется лишь подключение к локальной сети или Интернету и наличие вэб-браузера.

Из истории развития программы LimeSurvey

Первая версия этой программы (под названием PHPSurveyor) была написана в Австралии в 2003 году. В 2006 году руководство проектом перешло в Германию. На сегодняшний день программа LimeSurvey успешно используется в различных областях. Например, в 2004 году PHPSurveyor применялась в США в президентских выборах для сбора информации о нарушениях. В программе была составлена анкета для наблюдателей с описанием нарушения. За первые 10 часов выборов было зафиксировано 13500 различных нарушений, т.е. примерно 1300 в час. Это значит, что в течение 10 часов каждые 3 секунды система сохраняла очередную анкету, заполненную наблюдателем. Неплохой показатель для бесплатной программы.

XML-схема queXML

В австралийском Deakin University разработана XML-схема queXML, предназначенная для создания анкет. В основу данной схемы положена методика из книги Barnett, Robert "The Form Designer's Quick Reference Guide" 1994.

Схема анкеты, хранящаяся в формате queXML, может быть преобразована в профессионально выглядящую бумажную копию.

Приложением к формату queXML является программа queXF, которая позволяет проверить и распознать сканированные бумажные анкеты. Программа может распознавать только ответы-галочки. Распознавание цифр и текста - это только экспериментальная возможность, основанная на интеграции со свободной программой tesseract-ocr. Ограничением для опроса русскоязычных респондентов является то, что данная программа распознавания не поддерживает русский язык.

Структура программы LimeSurvey

LimeSurvey оперирует данными нескольких категорий. Это пользователи системы, опросы, наборы меток, респонденты, данные опросов.

  1. Пользователи системы, это люди, которые создают метки и опросы, приглашают респондентов принять участие в исследовании, а затем анализируют полученные данные. У каждого пользователя есть свои имя, ник, пароль и определенный набор прав. Права позволяют разным пользователям дать разные возможности по работе в LimeSurvey. Например, один пользователь может создавать и изменять опрос, а второй может только знакомиться с результатами опроса.

  2. Под опросом система LimeSurvey понимает саму анкету.

Создание бумажной копии из анкеты queXML-формата

Главное преимущество хранения анкеты в формате XML состоит в том, что такую анкету можно использовать для отображения разными способами, в т.ч. на бумаге. Для преобразования queXML в печатный вид необходима программа, которая создаст соответствующий файл для печати. Одной из таких программ является FOP - разработка проекта Apache. Ей на вход поступает исходный XML-документ и правила его преобразования в формат PDF (или PostScript). На выходе мы получаем PDF-файл.
В нашем конкретном случае с форматом queXML нам также потребуется программа barcode4j, которая позволяет создавать штрихкоды к анкете. Эти штрихкоды на анкетах впоследствии используются программой queXF при сканировании и распознавании заполненных анкет.
В еще более конкретном случае с русскоязычными анкетами для печати кириллицы в программе FOP необходимо зарегистрировать соответствующие шрифты. В качестве свободного варианта таких шрифтов можно использовать семейство Liberation Fonts.
После установки этих компонентов (кстати, FOP и barcode4j используют Java, именно это означает буква «j» в названии второй программы) вам становится доступным преобразование ваших queXML-анкет в PDF-версию. 

Создание титульного листа в анкете queXML-формата

В своей структуре формат queXML включает и титульный лист анкеты. Естественно, титульный лист будет полезен при самозаполнении анкеты респондентом, т.е. он играет роль приветствия и налаживания коммуникации между исследователем и респондентом. В формате queXML на титульный лист печатной версии выводится название опроса, информация об исследователе и его организации, дополнительно может быть добавлены данные о менеджере полевых работ и его организации (в случае, когда полевой этап отдается по подряду сторонней организации), а также ссылка на сайт, где респондент может заполнить анкету в электронном виде.
При создании анкеты в программе LimeSurvey, и последующем ее экспорте в формат queXML мне не удалось обнаружить возможности того, как задать информацию об исследователе, полевике и сайте. Поэтому если вы создаете анкету в LimeSurvey и при этом хотите печатать анкеты с титульным листом, вам потребуется влезать в код queXML. В принципе, это не сложно - нужно всего лишь заменить имеющиеся текстовые строки с данными австралийского университета (в котором и создан queXML) на свои родные.

Структура социологической анкеты по версии queXML

В LimeSurvey анкета состоит из групп, а группа состоит из вопросов. Если вы хотите сделать анкету с одним вопросом, то для этого вопроса вам придется сделать и группу, пусть она и будет содержать всего один вопрос. Подобная структура подвергается пользователями критике, и, возможно, в следующем серьезном обновлении программы (в версии 2) этот принцип будет изменен. Но сейчас мы подчиняемся этой логике.

Полная структура вопросника в queXML следующая:

  • заголовок опроса;

  • подзаголовок опроса (необязательно);

  • данные об исследователе:

    • имя и фамилия;

    • название организации и контактные данные (необязательно);

  • данные об исполнителе полевых работ (структура такая же, как в блоке о исследователе);

  • вводная информация об опросе (необязательно):

    • краткое содержание опроса;

    • тип заполнения анкеты (самостоятельно или интервьюером);

  • блок с вопросами (таких блоков, понятное дело, может быть несколько):

    • информация о блоке (необязательно, структура схожа с вводной информацией об опросе);

    • вопрос:

      • текст вопроса;

      • пояснение (qualifier) к вопросу (необязательно);

      • уточнение (specifier) к вопросу(необязательно);

      • указание к вопросу (необязательно):

        • расположение указания (до, после или в течение вопроса);

        • текст указания;

        • кто записывает ответ на вопрос (респондент или интервьюер);

      • ответ (их может быть несколько):

        • открытый (свободный) ответ:

          • формат ответа (валюта, дата, число, текст или длинный текст);

          • количество символов для ответа;

          • единица измерения (например, годы, проценты и пр.; необязательно);

          • минимум и максимум для числовых ответов (необязательно);

          • указание на переход к другому вопросу (необязательно);

        • ответ с вариантами (закрытый):

          • вариант ответа:

            • текст (метка) ответа;

            • значение ответа;

            • подвопрос (необязательно);

            • указание на переход к другому вопросу (необязательно).

Базовое описание формата queXML с примерами на английском языке: Victoria McNeil "How to convert a survey from word to queXML using Altova XML SPY 2005". Автор данного руководства опирается на коммерческую программу для редактирования XML, но в Интернете можно найти множество бесплатных альтернатив.

Последнее обновление ( 26.01.2009 г. )
 
« Пред.   След. »
Яндекс цитирования   Яндекс.Метрика