Диаграммы и графики

Прежде чем приступать к работе над данной темой, я отчетливо осознавал, что она категорически не относится к информатике. В полной мере почти весь круг вопросов должен раскрываться в курсе изучения статистической обработки данных. Просто есть некоторое количество технических нюансов, которые должны быть известны многим, а в особенности — обучающимся у меня студентам — будущим ученым.

На самом деле, страница должна разрастись до компенсации всего комплекса отсутствующих сведений, но на сегодня это далеко не так. Часть материала не согласована и отрывочна, требуется серьезная доработка, иллюстрирование и детализация теории. Курс предполагает всего три часа на изучение, и так выкроенные с большим трудом. Учитывая все сказанное выше, прошу отнестись к чтению с максимальным вниманием и творческим подходом, как к концентрату.

    Содержание
  1. Значение диаграмм в научном исследовании
  2. Основные виды диаграмм
  3. Типовые ошибки
  4. Цвет
  5. Черно-белые диаграммы
  6. Размещение в публикации
  7. Размер
  8. Линии на линейной диаграмме
  9. Оси, засечки, сетка, подписи, размерности, шкалы, легенда, объединение данных
  10. Построение диаграмм
  11. Основные доступные программы для построения диаграмм
  12. Подготовка файлов диаграмм для передачи издателю
  13. Список литературы

Для начала необходимо дать общее определение. К сожалению, большинство специализированных словарей «корректируют» его в соответствии с понятийным аппаратом обсуждаемой дисциплины. Это побуждает дать некую собирательную формулировку, применимую к любой области знания.

Диаграмма (от греч. dia — движение от начала до конца и gramm — запись: изображение, рисунок, чертеж), графическое изображение, наглядно показывающее соотношение между сравниваемыми величинами. Чаще всего для отображения используются различные системы координат.

Для наглядного представления информации диаграммы используются очень часто. Это связано с тем, что табличные данные не позволяют быстро сравнить показатели или динамику их изменения.

Для визуализации результатов научных исследований могут применяться специализированные программы для построения диаграмм. Нельзя также забывать о таком важном методе научного исследования, как графический анализ. Для этих целей можно воспользоваться как обычным программным обеспечением (ПО) (MS Graph в составе Excel), так и специализированным (Golden Software Grapher, Origin, статистические пакеты). Наиболее популярным пакетом для создания трехмерных диаграмм в научном мире является Golden Software Surpher.

Большинство случаев создания диаграмм связано с Microsoft Graph (MS Graph), о чем не подозревает практически никто. Дело в том, что ядро данной программы тесно интегрировано со всеми приложениями MS Office, хотя она может быть использована в любой другой программе, позволяющей производить вставку объектов.

Виды диаграмм

Для создания корректной диаграммы нужно четко представлять назначение отдельных разновидностей. Следует также предварительно внимательно изучить, что предлагают имеющиеся в вашем распоряжении программы.

Существует огромное количество подходов к классификации диаграмм, ни один из которых не описывает все виды или не раскрывает их сути до конца. Один из таких подходов заключается в том, что все многообразие диаграмм можно разделить по способу отображения данных: точками, линиями, столбиками и окружностями. Ниже приведены наиболее распространенные виды с кратким пояснением их смысла. (Значительная часть материала взята из книги Статистический словарь, М.: Финансы и статистика, 1989, 623 с.)

В дополнению к далеко не полному перечню (он будет постепенно пополняться), хочется обратить внимание читателя, что во многих профессиональных сферах существуют свои, специфические именно для этих областей, способы отображения данных, включая особые правила оформления. Прекрасными примерами могут быть финансовые, особенно биржевые диаграммы или результаты спектральных исследований.

Типовые ошибки

Эта проблема связана с двумя факторами. Во-первых, литературы по правилам и стандартам очень мало, да и доступность её для рядового пользователя недостаточна.


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Использование цвета

Для вывода графической информации на устройства отображения, поддерживающие цвет (монитор, проектор, цветной принтер) не следует избегать использования цветов. Они позволяют гораздо лучше показать сущность явлений. Как правило, цвета, подобранные по умолчанию, являются оптимальными и не требуют вмешательства. Хотя во многих программах последних лет отмечается использование гаммы пастельных тонов, неплохо смотрящихся только на ярком экране монитора.


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Дополнительно вопрос о цветных иллюстрациях в полиграфическом исполнении не обсуждается. Он достаточно глубоко проговорен на занятиях и на соответствующей странице сайта.

В некоторых случаях заранее известно, что будет производится черно-белая печать. Учет этого фактора может оказаться важнейшим. Следует ориентироваться на него с первого дня. Как пример, приведу материалы подавляющего большинства научных конференций, количество статей в которых в штучном выражении наверняка перекрывает все остальное.

Черно-белые диаграммы

Как уже сказано выше, иногда стоит сразу готовить рисунок к черно-белой печати. Это относится к абсолютному большинству научных работ, тираж которых изготавливается в типографии.

Если оставить цветное изображение, то оно будет воспроизводиться оттенками серого цвета. Какими — невозможно предсказать для большинства случаев, что связано с определенной зависимостью от технологии печати, качества оборудования, бумаги, краски, опытом печатника. Кроме того, небольшие области, прекрасно выделяющиеся в цвете, могут стать практически неразличимыми.

Полутона


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Штриховка

Для черно-белой печати наиболее разумно использование штриховки, что позволяет избежать всех проблем, связанных с растрированием.


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Следует учитывать, что, при совпадении направления штриховки с направлением отображающего количества элемента, их линии могут слиться. В качестве примеров возьмем горизонтальную штриховку для столбика небольшой высоты или горизонтальную — для узкого, косую штриховку при совпадении оси сектора с углом 45°. Здесь — можно привести первые столбики в каждой группе и последний столбик в группе 3 на рисунке ниже.

Описанная проблема особенно характерна для мелких рисунков в сочетании с редкой штриховкой.

Из сказанного вытекает, что присуждение штриховки следует производить на самой конечной стадии, когда появляется возможность проанализировать все имеющиеся в публикации диаграммы. Но, уже и на стадии их создания, следует учитывать такую перспективу. К сожалению, универсального решения просто не существует, а методические подходы уже обсуждены на занятии.

Размещение в публикации


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Все иллюстративные материалы в публикации должны иметь единое оформление!

Размер


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Линии на линейной диаграмме

Для использования цвета возникает очень мало проблем, кроме, разве, случаев, когда берутся слишком светлые оттенки для печати, либо при смене (особенно — инверсии) фона, например, с белого на черный.

Оси, засечки, сетка, подписи, размерности, легенда

Большинство диаграмм строится в координатных осях, представляющих собой угол или, реже, плоскость.

Базовое оформление рисунков по всей работе, независимо от ее назначения, должно быть одинаковым: толщина осей, засечек, кривых, сетки, длина засечек. Одни и те же явления на разных диаграммах следует также оформлять одинаково. Это может быть вид и толщина линий, обозначение точек, штриховка сплошных областей. Такой подход существенно упрощает восприятие информации читателем.


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Наконец, активно вошедшая в «моду» схема заключения рисунка в рамку, в основе чего лежит навязанное по умолчанию оформление в ряде программ. Скорее всего, к такому варианту следует отнестись отрицательно для большинства случаев размещения в текстовом документе. Графический элемент сам по себе зрительно отделяется от текстовых и не требует такого акцентирования.

Построение диаграмм

Подготовка исходных данных, их дополнительная математическая обработка.

Ввод данных

Предварительным этапом для построения диаграммы является подготовка данных, на основе которых она будет создана. К сожалению, эта проблема упирается в самое начало научного исследования, когда неверно поставленные задачи и, соответственно, несобранные данные не позволят ввести требуемую информацию. Вместе с тем, первичные данные в любом случае должны пройти предварительную обработку и быть сведены в таблицу.

Большинство программ при создании новой диаграммы позволяет ввести данные по умолчанию или содержит примеры (образцы), что помогает быстро разобраться, какие числовые значения строк и колонок формируют изображения.

Кроме того, первичные значения могут быть введены непосредственно в таблицу с данными, перенесены через буфер памяти (clipboard) из текста (обычно разделенные табуляторами) или электронной таблицы. Обычно они могут импортированы из файлов в форматах .TXT, .DIF, .CSV, электронных таблиц, баз данных.

Построение

В простых программах диаграммы строятся на основе всей таблицы с данными. Следует просто запросить (нажатием на кнопку, выполнением пункта меню или запуском Мастера) использование определенного типа и, возможно, ответить на несколько вопросов диалога.

Более «продвинутые» программы работают иначе. Большинство из них основывается на хранимой отдельно таблице с числовыми значениями (по аналогии со справочником в базе данных), по которой может быть создано множество различных диаграмм, сохраняемых в виде отдельных файлов или объединенных в проекты. Таким образом, с одной стороны, создается возможность использовать данные много раз, а с другой — рисунок состоит уже не из одного файла, а из нескольких. Это создает предпосылку к потере исходных данных: забыл переписать или удалил.

После построения многие программы не допускают изменения типа диаграммы, что не стоит рассматривать как серьезный недостаток. Внешний вид отображения зависит от цели и данных. Только знания и опыт могут позволить не ошибиться в выборе. Обычно, повторное построение «с нуля» не вызывает никаких проблем.

...

Основные доступные программы для построения диаграмм

Выбор программ научной графики обусловлен рядом причин.

Во-первых, это разнообразие способов представления данных и гибкость в их использовании. Важность данного критерия, безусловно, приоритетна, что связано с высокой значимостью графического метода статистического анализа и необходимостью подбора наиболее наглядных способов отображения.


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Хочется высказать надежду, что материал, изложенный в данной работе, поможет читателю сориентироваться в сложном мире визуализации данных.

При описании программ, в скобках указано название фирмы-производителя.

Microsoft Graph (Microsoft)

Любой пользователь начал бы этот список с программы, которая в данном случае в нем отсутствует: с Microsoft Excel. На самом деле, в нем используется программа Microsoft Graph, также легко доступная из любого приложения, поддерживающего OLE. MS Graph имеет посредственные и ограниченные возможности, которых явно недостаточно для многих научных задач. Вместе с тем, она прекрасно подходит для освоения основ работы и, с учетом расчетных возможностей Excel, создается довольно мощный комплекс. Однако, программе явно не хватает гибкости и дизайнерских возможностей. Почти 100 заявленных типов диаграмм — лишь попытка упростить работу пользователя, проделав за него часть оформления. На самом деле, в Microsoft Graph таких типов не более 20, а остальные стандартно реализуются в виде параметров оформления диаграмм или их элементов. В результате пользователь сталкивается с большим количеством противоречий.

Origin/OriginPro (OriginLab Corporation, ранее — Microcal)

Сайт разработчика.

Одна из самых мощных программ научной графики. Может частично интегрироваться с MS Excel.

Поддерживает программирование на языке, похожем на C, поддерживает элементы Visual Basic. Peak Fitting Module в версии OriginPro служит для работы с хроматографическими и спектроскопическими данными.

Grapher (Golden Software)

Сайт разработчика.

Может создавать более 30 видов диаграмм. При масштабировании рисунка сохраняет параметры линий и текста. Прекрасно выполняет черно-белую заливку.

Surpher (Golden Software)

Сайт разработчика.

Изначально ориентирована на построение трехмерных поверхностей. Позволяет легко строить истинно трехмерные диаграммы, наглядно иллюстрирующие взаимозависимость трех факторов, отображать их на плоскости в виде контуров или совмещать на одном рисунке оба типа построений. Содержит возможность построения вариограмм по экспериментальным данным и различным моделям. Поверхность может быть построена на массиве данных, содержащем до 1 млрд точек. Возможна дополнительная математическая обработка исходных данных. Поддерживает программирование на Visual Basic.

SigmaPlot (Systat Software Inc./SPSS Inc.).

Сайт разработчика. Выпущена версия 14, доступна — 12.5.

Позиционируется как система статистического анализа и визуализации научных данных.

StatGraphics Centurion (StatPoint Inc.) и STATISTICA (StatSoft)

Предназначены для статистической обработки данных, но попали сюда не случайно. Их возможности по графическому представлению результатов анализа весьма впечатляющи, они являются одним из безоговорочных стандартов в научной литературе.

Harvard Graphics Chart XL (Harvard Graphics)

Данное приложение было одним из родоначальником подготовки слайдов для презентаций, не существующая в данный момент. Вместе с тем она является достойным примером интеграции дополнительных возможностей, востребованных пользователем.

Очень простая, но мощная программа профессионального уровня, содержащая 29 основных и около 300 подвидов диаграмм, многократно перекрывая возможности MS Graph. В качестве основного недостатка можно назвать неспособность создавать качественные черно-белые штриховые заливки. (По сути относится к курьезам с учетом эпохи использования программы.)

Не следует забывать, что абсолютное большинство обсуждаемых программ строят диаграммы на основе собственных представлений об эстетике и правилах! В большинстве случаев это не соответствует не только международным и отечественным стандартам, но и просто здравому смыслу. Таким образом, еще одним из критериев выбора или, точнее, отказа от программы, становится возможность изменения стандартного форматирования.

Кроме того, существует огромное количество статистических и математических программ с возможностью построения диаграмм, как по массиву данных, так и по формуле. Как правило, их использование еще более сложно, а возможности несколько меньше, в связи с чем они рассматриваться не будут.

Подготовка файлов диаграмм для передачи издателю


Доступ к этим материалам предоставляется только зарегистрированным пользователям!


Список литературы

  1. Колесов А.А., Павлова О.Р. Пакеты научной и инженерной графики фирмы Golden Siftware, Мир ПК, 1996, 2, 66; 3, 34.
  2. Богданов А.А. Визуализация данных в Microcal Origin, М.: Альтекс А, 2003, 104 с.
  3. Р 50-77-88 Рекомендации. Единая система конструкторской документации. Правила выполнения диаграмм.
  4. Правила оформления кандидатской диссертации, автореферата, плана-проспекта.
  5. Электронный учебник StatSoft.
  6. ГОСТ Р 7.0.3-2006. Система стандартов по информации, библиотечному и издательскому делу.
  7. ГОСТ 7.32-2017 Система стандартов по информации, библиотечному и издательскому делу. Отчет о научно-исследовательской работе. Структура и правила оформления.
  8. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание (Общие требования и правила составления).
  9. Единая система конструкторской документации (ЕСКД).
  10. ГОСТ 2.105-95. Общие требования к текстовым документам.
  11. Википедия. (Данная ссылка приведена по причине нетривиального подхода к обсуждению, пусть сведения и изобилуют ошибками и несуразицами.)

Copyright © 1993–2020 Мацкявичюс Д.А. Все права защищены.
Никакая часть сайта не может быть воспроизведена никаким способом без письменного разрешения правообладателя и явной ссылки на данный ресурс.