Построить график гистограмма статистика дтп оформить диаграмму

Обновлено: 05.05.2024

Гистограмма (график со столбцами) — это один из самых простых способов представления данных в Excel, где для сравнения значений данных используются горизонтальные уровни. В этой инструкции будет пошагово показано, как создавать и форматировать гистограммы в Microsoft Excel.

Вставка столбцевых гистограмм в Microsoft Excel

Хотя вы потенциально можете превратить любой набор данных Excel в гистограмму, более разумно делать это с данными, когда возможно прямое сравнение, такое как сравнение данных о продажах для ряда продуктов. Вы также можете создать комбинированные диаграммы в Excel, где гистограммы могут быть объединены с другими типами диаграмм, чтобы показать два типа данных вместе.

Мы будем использовать вымышленные данные о продажах в качестве примера набора данных, чтобы помочь вам визуализировать, как эти данные могут быть преобразованы в гистограмму в Excel. Для более сложных сравнений лучше использовать альтернативные типы диаграмм, такие как статистические диаграммы.

Чтобы вставить гистограмму в Microsoft Excel, откройте свою книгу Excel и выберите свои данные. Вы можете сделать это вручную, используя мышь, или вы можете выбрать ячейку в вашем диапазоне и нажать Ctrl+A, чтобы выбрать данные автоматически.



Excel автоматически возьмёт данные из вашего набора данных для создания диаграммы на том же рабочем листе, используя метки столбцов для установки осей и названий диаграмм. Вы можете переместить или изменить размер диаграммы в другую позицию на том же листе, либо вырезать или скопировать диаграмму в другой лист или файл книги.

Для нашего примера данные о продажах были преобразованы в гистограмму, показывающую сравнение количества продаж для каждого электронного продукта.


Для этого набора данных колонок купили меньше всего с 9 продажами, тогда как мобильные телефоны купили больше всего с 64 продажами. Это сравнение наглядно видно из представленной диаграммы.

Форматирование гистограмм в Microsoft Excel

По умолчанию гистограмма в Excel создаётся с использованием заданного стиля, при этом заголовок для диаграммы экстраполируется на одну из меток столбца (если имеется).

Если хотите, вы можете внести много изменений в форматирование своей диаграммы. Вы можете изменить цвет и стиль своей диаграммы, изменить название диаграммы, а также добавить или отредактировать метки осей с обеих сторон.

Изменение текста заголовка диаграммы

Чтобы изменить текст заголовка для гистограммы, дважды щёлкните текстовое поле заголовка над самой диаграммой. После этого вы сможете редактировать или форматировать текст по мере необходимости.



Заголовок вашего графика будет удалён после снятия флажка.

Добавление и редактирование названий оси


Метки оси должны отображаться как для оси x (внизу), так и для оси y (слева). Они появятся в виде текстовых полей.

Чтобы изменить метки, дважды щёлкните текстовые поля рядом с каждой осью. Отредактируйте текст в каждом текстовом поле как вам нужно, а затем кликните в любое место за пределами текстового поля, как только вы закончите вносить изменения.


Изменение стиля и цвета диаграммы


Выберите один из этих стилей, чтобы изменить внешний вид диаграммы, включая изменение макета панели и фона.



Параметры цвета сгруппированы, поэтому выберите одну из групп цветовой палитры, чтобы применить эти цвета к диаграмме.


Вы можете проверить каждый цветовой стиль, наводя на них курсор мыши. Ваша диаграмма изменится, чтобы показать, как диаграмма будет выглядеть когда эти цвета применены.

Дополнительные параметры форматирования гистограммы





Вы также можете использовать всплывающее меню форматирования, которое появляется над текстовыми полями, заголовком диаграммы или метками оси при их редактировании.

Гистограмма — это тип диаграммы, которую вы можете создать на основе данных в Excel. Это позволяет легко суммировать частоту определенных значений в вашем наборе данных. Excel упрощает создание гистограммы, предполагая, что гистограмма — это действительно то, что вам нужно!


Что такое гистограмма?

Гистограмма — это тип диаграммы, в которой вертикальные полосы используются для суммирования диапазонов данных. Хотя это может выглядеть как гистограмма, между ними есть существенные различия. Гистограммы показывают различия между переменными, тогда как гистограммы обычно используются для отображения различий между переменными с точки зрения другой переменной.


Вертикальная ось Y показывает нам, сколько измерений этой переменной попадает в каждый диапазон ячеек. Итак, если у вас есть 100 человек, которые напишут тест IQ, каждый человек, чей результат попадает в определенную ячейку, засчитывается для оценки частоты этой ячейки.

С помощью гистограммы вы можете сравнить что-то вроде среднего показателя IQ между странами. В этом случае каждая полоса может представлять страну, а вертикальная ось Y представляет средний IQ этой страны.

Когда следует использовать гистограмму?


Конечно, если вы действительно хотите определить, является ли ваше частотное распределение нормальным или нет, вы должны запустить тест нормальности в Excel для своих данных. Эти тесты по-прежнему используют гистограммы в качестве основы, и создание и наблюдение за гистограммой является важным первым шагом, показывающим вам, с каким типом распределения вы можете иметь дело.

Что нужно для построения гистограммы

Чтобы построить гистограмму, вам понадобится несколько вещей:

Первое требование довольно простое. Например, если бы у вас были веса группы людей, вы бы записали каждый измеренный вес в ваш набор данных. Будьте осторожны, чтобы не смешивать данные из групп, которые вы не хотите измерять, в одну гистограмму. Например, если вы хотите посмотреть только распределение веса определенной возрастной группы или пола, вам следует включить данные только для этой группы.

Если вы хотите сравнить частотные распределения между двумя группами по одной переменной, вам понадобится несколько гистограмм. По одному на каждую группу населения.


Вы также можете оставить это автоматической функции в Excel, где она попытается выбрать ширину ячейки, которая лучше всего подходит для ваших данных. В Excel вы также можете указать количество ячеек, включая необязательные так называемые ящики переполнения и недополнения. Они фиксируют все оценки выше и ниже указанного значения.

Создание гистограммы в Excel: шаг за шагом

Создание гистограммы занимает всего несколько щелчков мышью. Мы используем последнюю версию Microsoft 365 здесь, но любая версия Office, начиная с 2016, будет работать так же.

  1. Предполагая, что вы ввели все значения для своего набора данных, выберите все значения, которые должны быть включены в гистограмму.



Настройте горизонтальную ось

Теперь ваша гистограмма находится на листе, но, вероятно, она выглядит не так, как вам хотелось бы. Итак, теперь мы собираемся настроить горизонтальную ось:

  1. Щелкните правой кнопкой мыши горизонтальную ось.
  2. Выберите Ось формата.


Панель оси формата теперь будет открыта. Здесь есть ряд важных параметров, которые можно использовать для настройки гистограммы, чтобы она выглядела именно так, как вам нужно.

От гистериграммы к гистограмме

Надеюсь, теперь вы можете легко построить гистограмму, но если вам нужно ознакомиться с основными концепциями Excel, попробуйте прочитать Руководство по основам Microsoft Excel — Обучение использованию Excel

Гистограмма распределения - это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа


Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Перед тем как анализировать полученный результат - отсортируйте исходный массив данных .

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно - максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .


Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.


Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.


Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).


Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.


В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество - 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() - Подсчет ЧИСЛОвых значений в MS EXCEL .

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .


В итоге можно добиться вот такого результата.

Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .


Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

Гистограмма распределения - это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа


Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Перед тем как анализировать полученный результат - отсортируйте исходный массив данных .

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно - максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .


Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.


Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.


Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).


Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.


В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество - 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() - Подсчет ЧИСЛОвых значений в MS EXCEL .

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .


В итоге можно добиться вот такого результата.

Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .


Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

Читайте также: