Разбираем возможности облачной базы данных Google BigQuery, которая позволяет хранить огромный объем данных и быстро их обрабатывать.

Подключенные таблицы: обработка данных за пару минут

ПРОЕКТ РАЗРАБОТЧИКОВ HELPEXCEL.PRO

Подключенные таблицы позволяют объединить мощности BigQuery с простотой Google таблиц. Это очень облегчает работу с большим количеством данных и позволяет анализировать и изменять миллиарды строк информации без навыков программирования (SQL, Python).

Рассмотрим на примере базы данных с данными о работе сервисов такси в Чикаго.

Не хотите разбираться в непонятных формулах?

Настройте учет с помощью бесплатных шаблонов.

Подключение базы данных к таблице

В таблице нажимаем кнопку «Данные» в верхнем меню. В строке «Коннекторы данных» выбираем «Подключиться к BigQuery».

Затем выбираем проект, созданный в сервисе Google Cloud, к которому нужно подключиться.

В проекте выбираем набор данных (в нашем примере – любой общедоступный) и в нем выбираем нужную таблицу.

Готово! Всего пара кликов, и у вас доступ к таблице с миллиардом ячеек.

В таблице, которая появилась на новом листе, мы видим только 500 строк. Если использовать функции подключенной таблицы (диаграммы, сводные таблицы и др.), покажется вся исходная таблица. В нашем примере это 59 миллионов строк.

Сэкономьте время и организуйте учет в компании на индивидуальной консультации с нашим специалистом.

Функции подключенной таблицы

Чтобы создать функцию, нажмите на нужную кнопку в верхней панели. Отобразятся все доступные функции для данного проекта.

Теперь посчитаем количество таксомоторных компаний. Выбираем функцию “COUNTUNIQUE” и вставляем ее на новый лист. На этом листе редактируем формулу, указав столбец для подсчета уникальных значений. В нашем примере – столбец “company”.

Нажимаем кнопку «Применить» и получаем ответ 169.

Рассмотрим еще пример, как в три формулы высчитать процент поездок с чаевыми. Посчитаем количество поездок с чаевыми (tips), количество поездок с оплатой (fare) разделив первое число на второе.

Диаграммы

Чтобы создать диаграмму, нажмите на эту кнопку в верхней панели.

Вставим ее на новый лист. Для примера создадим диаграммы анализа популярных типов оплаты. В редакторе диаграмм выберем тип диаграммы.

Указываем поле, которое используется в качестве ярлыка и значения. Для этого просто перетаскиваем его в нужную ячейку. В нашем примере, ярлык – поле с типом оплаты, а значение – поле с данными о самой оплате. В последнем указываем, что именно считаем: сумму, количество и т.д. Нажимаем «Применить» диаграмма готова.

На диаграмме видно, что сумма оплаты наличными практически равна сумме оплаты картой. Но как посчитать количество оплат?

Меняем параметр значения и получаем новую диаграмму, на которой видно, что наличная оплата в почти в 1,5 раза популярнее оплаты картой.

В диаграмме можно использовать фильтры. Попробуем создать график с количество заказов в промежуток времени.

Выберем поездки, оплаченные картой. Нажмем «Добавить фильтр», выберем «Тип оплаты» и отфильтруем по значению «Credit card».

Жмем «Применить» и получаем новый график.

Больше информации о фильтрах в Google таблицах можно найти в этой статье.

Сводные таблицы

Чтобы создать сводную таблицу, нужно нажать на соответствующую кнопку в верхней панели.

Вставляем ее на новый лист. Теперь мы видим содержимое сводной таблицы слева и ее редактор справа.

К примеру, мы хотим вычислить количество поездок в определенный час дня. Указываем строки – время начала поездки, сгруппированное по часам, значения – количество строк столбца с суммами оплаты.

Можно также вставить в столбцы даты поездок с разбивкой по дням недели и сделать отчет более подробным.

Добавим условное форматирование. Ячейки с наибольшими значениями стали темнее. Теперь видно, что большинство поездок совершаются ночью или ранним утром в рабочие дни.

Также можем вычислить, когда такси стоит дороже всего. Для этого изменим правило суммирования значения с COUNTA на AVERAGE и увидим, что дороже всего такси утром рабочего дня.

Рассчитываем, кто из 5 компаний заработал больше по каждому из типов оплаты. Выставляем настройки и получаем такую сводную таблицу.

Фрагмент

В подключенной таблице мы видим только 500 строк, но если нужно больше информации, используем функцию «Фрагмент».

В открывшемся редакторе выбираем нужные столбцы и количество строк. Здесь же можно отфильтровать полученные данные.

Вычисляемый столбец

С помощью подключенных таблиц можно создавать вычисляемые столбцы. То есть данные этих столбцов будут подтягиваться и обрабатываться таблицей. Для создания такого столбца нажимаем кнопку сверху панели.

В меню указываем имя столбца, формулу, по которой будет получаться конечное значение и просмотреть доступные столбцы таблицы и функции.

Для примера, добавим столбец с процентом чаевых за поездку.

Обновление данных

Все данные в присоединенной таблице останутся не обновленными, пока вы сами не обновите их. Даже если в хранилище BigQuery данные изменятся.

Для каждого объекта указывается время, в которое он обновлялся в последний раз. Кнопка «Обновить» показывает актуальные данные.

Чтобы не обновлять каждый элемент таблицы, в панели управления bigQuery есть кнопка настройки параметров обновления.

Нажав ее, открываем меню и обновляем нужные элементы и все сразу (кнопка «Обновить все»).

Частоту планового обновления также настраиваем нажатием на кнопку.

Эти настройки избавят вас от обязанности следить за актуальностью данных.

Базовые решения для вашего бизнеса
Удобные системы оптимизации с учетом особенностей вашей отрасли.
На этом все!

Еще больше полезных материалов вы можете найти в нашем Telegram-канале:

Хотите обсудить свой проект?

Если Вам понравился наш кейс и Вы бы хотели проконсультироваться с нашей командой по поводу внедрения подобного решения в Вашу компанию, оставьте заявку и мы свяжемся с Вами в ближайшее время.

Для обсуждения вашей задачи напишите нам в WhatsApp. Проведем аудит и предложим решение.