Диаграммы и графики

Прежде чем приступать к работе над данной темой, я отчетливо осознавал, что она категорически не относится к информатике. В полной мере почти весь круг вопросов должен раскрываться в курсе изучения статистической обработки данных. Просто есть некоторое количество технических нюансов, которые должны быть известны многим, а в особенности — обучающимся у меня студентам — будущим ученым.

На самом деле, страница должна разрастись до компенсации всего комплекса отсутствующих сведений, но на сегодня это далеко не так. Часть материала не согласована и отрывочна, требуется серьезная доработка, иллюстри­рование и детализация теории. Курс предполагает всего три часа на изучение, и так выкроенные с большим трудом. Учитывая все сказанное выше, прошу отнестись к чтению с максимальным вниманием и творческим подходом, как к концентрату.

Сведения долго готовились до момента публикации и подвергаются ежегодной корректировке и дополнению.

Содержание

Введение (значение диаграмм в научном исследовании)
Разработка
Виды диаграмм
Типовые ошибки
Цвет
Черно-белые диаграммы
Полутона
Штриховка
Размещение в публикации
Размер
Линии на линейной диаграмме
Оси, засечки, сетка, подписи, размерности, шкалы, легенда, объединение данных
Построение диаграмм
Ввод данных
Построение
Основные доступные программы
Подготовка файлов диаграмм для передачи издателю
Фальсификация данных
Список литературы

Введение

Для начала необходимо дать общее определение. К сожалению, большинство специализированных словарей «коррек­тируют» его в соответствии с понятийным аппаратом обсуждаемой дисциплины. Это побуждает дать некую собира­тельную формулировку, применимую к любой области знания.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Для наглядного представления информации диаграммы используются очень часто. Это связано с тем, что табличные данные не позволяют быстро сравнить показатели или динамику их изменения.

Для визуализации результатов научных исследований могут применяться специализированные программы для построения диаграмм. Нельзя также забывать о таком важном методе научного исследования, как графический анализ, относящийся к обязательной стадии оценки данных, предваряющей другие виды статистической обработки. Для этих целей можно воспользоваться как обычным программным обеспечением (ПО) (MS Graph в составе Excel), так и специализированным (Golden Software Grapher, Origin, статистические пакеты). Наиболее популярной программой для создания трехмерных диаграмм в научном мире разумно признать Golden Software Surpher, хотя такая возможность постепенно интегрируется во все развивающиеся приложения.

Тенденцией последних лет также следует считать использование интерактивных диаграмм, позволяющих производить изменение данных, детализацию и погружение «на лету», в процессе демонстрации. В качестве наиболее доступного варианта можно привести пример разработки дашбордов в Google Data Studio. К этой же категории можно отнести работу со сводными таблицами Excel, если для них задействованы диаграммы.

Большинство случаев создания диаграмм связано с Microsoft Graph (MS Graph), о чем не подозревает практически никто. Дело в том, что ядро данной программы тесно интегрировано со всеми приложениями MS Office, хотя она может быть использована в любой другой программе, позволяющей производить вставку объектов.

Ситуация несколько сдвинулась за последние годы, но об этом будет отдельный разговор....

Разработка

Естественно, что самой первой сутью должен быть определенный алгоритм, приводящий от первичной мысли к её реализации в виде диаграммы. Казалось бы очевидная идея оказывается на противоречивом стыке «очевидно»—«непонятно», что и порождает огромное количество никому не нужной и ничего не иллюстрирующей графики.

Способность проведения соответствующего анализа и выбора не может быть переоценена. Постепенное накопление вдумчивого опыта, которое чисто умозрительно должно было бы происходить в средней и старшей школе, со временем будет приводить к быстрому и эффективному нахождению наилучших решений, включая оценку доступности трансформации при возникновении такой необходимости. Да, но в школе этого просто нет по причине отсутствия не только соответствующего курса, но и ложности самой доктрины подготовки, равно как и массового отсутствия требующихся системных знаний у учителей. Последнее никак не компенсируется амбициями и декларированием.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Основные виды диаграмм

Для создания корректной диаграммы нужно четко представлять назначение отдельных разновидностей. Следует также предварительно внимательно изучить, что предлагают имеющиеся в вашем распоряжении программы.

Существует огромное количество подходов к классификации диаграмм, ни один из которых не описывает все виды или не раскрывает их сути до конца. Один из таких подходов заключается в том, что все многообразие диаграмм можно разделить по способу отображения данных: точками, линиями, столбиками и окружностями. Ниже приведены наиболее распространенные виды с кратким пояснением их смысла. (Значительная часть материала взята из книги Статистический словарь, М.: Финансы и статистика, 1989, 623 с.)

В дополнение к далеко не исчерпывающему перечню (он будет постепенно пополняться) хочется обратить внимание читателя, что во многих профессиональных сферах существуют свои, специфические именно для этих областей, способы отображения данных, включая особые правила оформления. Прекрасными примерами могут быть финансовые, особенно биржевые диаграммы, частично приведенные, или результаты спектральных исследований.

За последние годы разработчики свободного ПО придумали множество вариантов визуализации, многие из которых позволяют крайне эффективно оценить данные. Не стоит делать из этого культа и относить их к разряду классических. Но применять надо обязательно! Любой вариант представления информации, который поможет лучше понять процесс или явление, должен быть использован!


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Типовые ошибки

Эта проблема связана с двумя факторами. Во-первых, литературы по правилам и стандартам очень мало, да и доступность её для рядового пользователя недостаточна.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


....

Использование цвета

Для вывода графической информации на устройства отображения, поддерживающие цвет (монитор, проектор, цветной принтер) не следует избегать его использования. Это позволит гораздо лучше показать сущность явлений, зрительно разделить данные. Как правило, цвета, подобранные по умолчанию, являются оптимальными и не требуют вмешательства. Хотя во многих программах последних лет отмечается использование гаммы пастельных тонов, неплохо смотрящихся только на ярком экране монитора.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Дополнительно вопрос о цветных иллюстрациях в полиграфическом исполнении не обсуждается. Он достаточно глубоко проговорен на занятиях и на соответствующей странице сайта.

В некоторых случаях заранее известно, что будет производится черно-белая печать. Учет этого фактора может оказаться важнейшим. Следует ориентироваться на него с первого дня. В качестве примера приведу материалы подавляющего большинства научных конференций, количество статей в которых в штучном выражении наверняка перекрывает все остальное.

Черно-белые диаграммы

Как уже сказано выше, иногда стоит сразу готовить рисунок к черно-белой печати. Это относится к абсолютному большинству научных работ, тираж которых изготавливается в типографии.

Если оставить цветное изображение, то оно будет воспроизводиться оттенками серого цвета. Какими — невозможно предсказать для большинства случаев, что связано с определенной зависимостью от технологии печати, качества оборудования, бумаги, краски, опыта печатника. Кроме того, небольшие области, прекрасно выделяющиеся в цвете, могут стать практически неразличимыми.

Полутона


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


....

Штриховка

Для черно-белой печати наиболее разумно использование штриховки, что позволяет избежать всех проблем, связанных с растрированием.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Следует учитывать, что, при совпадении направления штриховки с направлением отображающего количества элемента, их линии могут слиться. В качестве примеров возьмем горизонтальную штриховку для столбика небольшой высоты или горизонтальную — для узкого, косую штриховку при совпадении оси сектора с углом 45°. Здесь можно привести первые столбики в каждой группе и последний столбик в группе 3 на рисунке ниже.

Описанная проблема особенно характерна для мелких рисунков в сочетании с редкой штриховкой.

Из сказанного вытекает, что присуждение штриховки следует производить на самой конечной стадии, когда появляется возможность проанализировать все имеющиеся в публикации диаграммы. Но, уже и на стадии их создания, следует учитывать такую перспективу. К сожалению, универсального решения просто не существует, а методические подходы уже обсуждены на занятии.

Размещение в публикации


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Все иллюстративные материалы в публикации должны иметь единое оформление!

Размер


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Линии на линейной диаграмме

Для использования цвета возникает очень мало проблем, кроме, разве, случаев, когда берутся слишком светлые оттенки для печати, либо при смене (особенно — инверсии) фона, например, с белого на черный.

Зато с количеством их немало. Обычно рекомендуется создавать не более 6–8 линий, но это не так просто, иногда необходимо удвоение их количества и подобрать существенно отличающиеся цвета сложно.

Представьте себе, что три из них практически сливаются на одном уровне оси ординат, а другие три — на другом. Считать подобную информацию можно лишь как тенденцию.

Сложное пересечение линий может легко запутать, поэтому может потребоваться смена типов для цветных линий, обязательная для черно-белой публикации.

Дополнительную головную боль принесет необходимость одинакового оформления нескольких идентичных диаграмм в одной публикации, что относится к стандартным требованиям. Можно порекомендовать вначале построить все диаграмы, а затем произвести поиск проблемных мест и начать оформление именно с них.

....

Оси, засечки, сетка, подписи, размерности, легенда

Большинство диаграмм строится в координатных осях, представляющих собой угол или, реже, плоскость.

Базовое оформление рисунков по всей работе, независимо от ее назначения, должно быть одинаковым: толщина осей, засечек, кривых, сетки, длина засечек. Одни и те же явления на разных диаграммах следует также оформлять одинаково. Это может быть вид и толщина линий, обозначение точек, штриховка сплошных областей. Такой подход существенно упрощает восприятие информации читателем.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Наконец, активно вошедшая в «моду» схема заключения рисунка в рамку, в основе чего лежит навязанное по умолчанию оформление в ряде программ. Скорее всего, к такому варианту следует отнестись отрицательно для большинства случаев размещения в текстовом документе. Графический элемент сам по себе зрительно отделяется от текстовых и не требует такого акцентирования.

Построение диаграмм

Подготовка исходных данных, их дополнительная математическая обработка....

Ввод данных

Предварительным этапом для построения диаграммы является подготовка данных, на основе которых она будет создана. К сожалению, эта проблема упирается в самое начало научного исследования, когда неверно поставленные задачи и, соответственно, несобранные данные не позволят ввести требуемую информацию. Вместе с тем, первичные данные в любом случае должны пройти предварительную обработку и быть сведены в таблицу.

Большинство программ при создании новой диаграммы позволяет ввести данные по умолчанию или содержит примеры (образцы), что помогает быстро разобраться, какие числовые значения строк и колонок формируют изображения.

Кроме того, первичные значения могут быть введены непосредственно в таблицу с данными, перенесены через буфер памяти (clipboard) из текста (стандартно разделенные табуляторами) или электронной таблицы. Обычно они могут быть импортированы из файлов в форматах .TXT, .DIF, .CSV, электронных таблиц, баз данных.

Построение

В простых программах диаграммы строятся на основе всей таблицы с данными. Следует просто запросить (нажатием на кнопку, выполнением пункта меню или запуском Мастера) использование определенного типа и, возможно, ответить на несколько вопросов диалога.

Более «продвинутые» программы работают иначе.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


....

Основные доступные программы для построения диаграмм

Выбор программ научной графики обусловлен рядом причин.

Во-первых, это разнообразие способов представления данных и гибкость в их использовании. Важность данного критерия, безусловно, приоритетна, что связано с высокой значимостью графического метода статистического анализа и необходимостью подбора наиболее наглядных способов отображения.


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Хочется высказать надежду, что изложенный здесь материал поможет читателю сориентироваться в сложном мире визуализации данных.

При описании программ в скобках указано название фирмы-производителя.

Microsoft Graph (Microsoft)

Любой пользователь начал бы этот список с программы, которая в данном случае в нем отсутствует: с Microsoft Excel. На самом деле, в нем используется программа Microsoft Graph, также легко доступная из любого приложения, поддерживающего OLE. MS Graph имеет посредственные и ограниченные возможности, которых явно недостаточно для многих научных задач. Вместе с тем, она прекрасно подходит для освоения основ работы и, с учетом расчетных возможностей Excel, создается довольно мощный комплекс. Однако программе явно не хватает гибкости и дизайнерских возможностей. Почти 100 заявленных типов диаграмм — лишь попытка упростить работу пользователя, проделав за него часть оформления. На самом деле, в Microsoft Graph таких типов не более 20, а остальные стандартно реализуются в виде параметров оформления диаграмм или их элементов. В результате пользователь сталкивается с большим количеством противоречий.

....

Origin/OriginPro (OriginLab Corporation, ранее — Microcal)

Сайт разработчика.

Одна из самых мощных программ научной графики. Может частично интегрироваться с MS Excel.

Поддерживает программирование на языке, похожем на C, поддерживает элементы Visual Basic. Peak Fitting Module в версии OriginPro служит для работы с хроматографическими и спектроскопическими данными.

По совокупности анализа ситуации, именно эта программа выбрана для описания, которое готовится в настоящий момент. Имеющаяся в доступе литература дает лишь поверхностное представление о возможностях и использовании, а также она устарела.

Grapher (Golden Software)

Сайт разработчика.

Может создавать более 30 видов диаграмм. При масштабировании рисунка сохраняет параметры линий и текста. Прекрасно выполняет черно-белую заливку.

Surpher (Golden Software)

Сайт разработчика.

Изначально ориентирована на построение трехмерных поверхностей. Позволяет легко строить истинно трехмерные диаграммы, наглядно иллюстрирующие взаимозависимость трех факторов, отображать их на плоскости в виде контуров или совмещать на одном рисунке оба типа построений. Содержит возможность построения вариограмм по экспериментальным данным и различным моделям. Поверхность может быть построена на массиве данных, содержащем до 1 млрд точек. Возможна дополнительная математическая обработка исходных данных. Поддерживает программирование на Visual Basic.

SigmaPlot (Systat Software Inc./SPSS Inc.).

Сайт разработчика. Выпущена версия 14, доступна — 12.5.

Позиционируется как система статистического анализа и визуализации научных данных.

StatGraphics Centurion (StatPoint Inc.) и STATISTICA (StatSoft)

Предназначены для статистической обработки данных, но попали сюда не случайно. Их возможности по графическому представлению результатов анализа весьма впечатляющи, они являются одним из безоговорочных стандартов в научной литературе.

Harvard Graphics Chart XL (Harvard Graphics)

Данное приложение было одним из родоначальников подготовки слайдов для презентаций, не существующая в данный момент. Вместе с тем она является достойным примером интеграции дополнительных возможностей, востребованных пользователем.

Очень простая, но мощная программа профессионального уровня, содержащая 29 основных и около 300 подвидов диаграмм, многократно перекрывая возможности MS Graph. В качестве основного недостатка можно назвать неспособность создавать качественные черно-белые штриховые заливки. (По сути, относится к курьезам с учетом эпохи использования программы.)


Не следует забывать, что абсолютное большинство обсуждаемых программ строят диаграммы на основе собственных представлений об эстетике и правилах! В большинстве случаев это не соответствует не только международным и отечественным стандартам, но и просто здравому смыслу. Таким образом, еще одним из критериев выбора или, точнее, отказа от программы становится возможность изменения стандартного форматирования.

Кроме того, существует огромное количество статистических и математических программ с возможностью построения диаграмм, как по массиву данных, так и по формуле, две из которых упомянуты выше. Как правило, их использование еще более сложно, а возможности несколько меньше, в связи с чем они рассматриваться не будут.

Также за последнее десятилетие сформировалось огромное количество JavaScript-библиотек для визуализации данных.

Подготовка файлов диаграмм для передачи издателю

Оптимальным будет вариант с передачей издателю оригинала (бумажной копии) и файлов в


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Фальсификация данных на диаграмме

Двоякая, даже, скорее — троякая проблема: создать, распознать, не допустить. Сам по себе заголовок раздела вносит негативный оттенок к осуществлению подобных действий, но они не только выполняются, но и бывают необходимы.

Ниже будет предпринята попытка собрать и обобщить некоторые скудные сведения из литературы и личных наблюдений. По существу здесь происходит тесное смыкание с практическим применением технологий «черного пиара» и откровенным манипулированием восприятием аудитории. То есть «как заставить увидеть на диаграмме не то, что там показано».


Доступ к этим материалам предоставляется только зарегистри­рован­ным пользователям!


Очень сложно сделать из всего сказанного какой-либо однозначный вывод. Создавая этот небольшой раздел, я прекрасно понимал, что подталкиваю часть читателей к реализации недопустимого. Однако мне было гораздо важнее, чтобы остальные могли без труда распознать эти фальшивки и дать верную оценку не только фактам, но и их авторам.

Могу только посоветовать внимательно читать все диаграммы.

Список литературы

  1. * Единая система конструкторской документации (ЕСКД).
  2. * Р 50-77-88 Рекомендации. Единая система конструкторской документации. Правила выполнения диаграмм, М: Государственный комитет СССР по стандартам, 1989, 11 с.
  3. * ГОСТ 7.32-2017 Система стандартов по информации, библиотечному и издательскому делу. Отчет о научно-исследовательской работе. Структура и правила оформления (раздел 6.5), 31 с.
  4. Колесов А.А., Павлова О.Р. Пакеты научной и инженерной графики фирмы Golden Siftware, Мир ПК, 1996, 2, 66; 3, 34.
  5. Богданов А.А. Визуализация данных в Microcal Origin, М.: Альтекс А, 2003, 104 с.
  6. Правила оформления кандидатской диссертации, автореферата, плана-проспекта.
  7. Электронный учебник по статистике StatSoft.
  8. ГОСТ 7.32-2017 Система стандартов по информации, библиотечному и издательскому делу. Издания. Основные элементы. Термины и определения
  9. ГОСТ Р 2.105-2019 Единая система конструкторской документации. Общие требования к текстовым документам
  10. Википедия. (Данная ссылка приведена по причине нетривиального подхода к обсуждению, пусть сведения и изобилуют ошибками и несуразицами.)

* Обязательная к изучению студентами ВХК литература.


Copyright © 1993–2024 Мацкявичюс Д.А. Все права защищены.
Никакая часть сайта не может быть воспроизведена никаким способом без письменного разрешения правообладателя и явной ссылки на данный ресурс.