Izveštaji Google BigKueri i Google Data Studio

September 2, 2024

Kao što već znate iz našeg Prethodni blog post, Daktela nudi širok spektar alata za izveštavanje. Da biste stvari učinili jednostavnim, možete zamisliti da Daktela ima 2 grane alata za izveštavanje i analitiku:

  1. Statistika i analitika dostupna u veb aplikaciji Daktela
  2. Google rešenje

Iako je Daktela složena veb aplikacija i sadrži robusne analitičke alate iz kutije, u nekim slučajevima može biti korisno odlučiti se za spoljnu uslugu. Možda biste želeli da razmislite o korišćenju jednog posebno ako:

  • Imati velike količine podataka
  • Koristite nekoliko PBKS-a
  • Potrebno je da se pridruže tabelama
  • Želite napredno filtriranje podataka izveštaja
  • Zabrinuti ste zbog PBKS opterećenja
  • Zahtevaju brže vreme učitavanja

Moderno i super moćno Google rešenje idealan je kandidat za ove svrhe. Brzo ćemo ga pogledati u ovom članku.

Generalno, rešenje je kombinacija skladištenja podataka (Google BigKueri), alata za izveštavanje (Google Data Studio), partnerskih usluga (Google Cloud Platform - bezbednost, upravljanje, održavanje, praćenje) i tokova podataka (Daktela), čineći ETL i BI portfolio.

Jasna prednost je što je rešenje dostupno pomoću veb pregledača. Nije potreban namenski softver; sve je dostupno sa bilo kog računara koji koristi Google nalog sa dovoljnim pravima. Operabilnost sistema zavisi samo od brzine vaše internet veze.

Daktela — automatska sinhronizacija

Postoje periodični zadaci postavljeni na bigkueri.daktela.com koji transformišu podatke sa PBKS-a i učitavaju ih na BigKueri (BK) u redovnim intervalima. Ove takozvane skripte za pokretanje napisane su na Javi.

Interval sinhronizacije je 120 minuta i 24 sata. Podaci se periodično učitavaju svaka 2 sata, a na kraju svakog dana u ponoć učitava se još jedna serija konsolidacije kako bi se osigurao integritet podataka. Na odabranim PBKS-ovima moguće je skratiti interval od 2 sata na 1 sat.

U izolovanim slučajevima, naizgled duplicirani unosi mogu biti kreirani u BK. Skripta za pokretanje traži duplikate, njen izlaz se prati i obaveštenja se šalju softveru za nadgledanje. Duplikati se automatski uklanjaju tokom dnevne sinhronizacije. To znači da ne morate da radite ništa dodatno da biste ažurirali podatke o izveštavanju.

Pošto se pokretne skripte svih projekata povezanih sa BK pokreću na bigkueri.daktela.com server, planirano je da rade u različito vreme tako da se ne takmiče jedni protiv drugih i tako se sistemski resursi efikasno koriste. Ovo takođe doprinosi relativno kratkom vremenu obrade. Korak sinhronizacije (učitavanje satne ili dnevne serije za sve instance projekta) je pitanje minuta do desetina minuta - obično 10-30 minuta, do 60-90 minuta u ekstremnim slučajevima. Prilikom otklanjanja grešaka, sinhronizacija se takođe može pokrenuti ručno.

Sve skripte izlaze dnevnik tekstualne datoteke.

Pristup bigkueri.daktela.com server je obezbeđen pomoću SSH ključa. Serverom u potpunosti upravljaju Daktela IT administratori koji takođe upravljaju korisničkim pristupom.

Google BigKueri

BigKueri je potpuno upravljano skladište podataka bez servera (DVH) koje omogućava skalabilnu analizu na izuzetno velikim količinama podataka (redosledom petabajta: 1PB ≈ 1024 TB ≈ 1 milion GB). To je platforma kao usluga koja podržava upite pomoću ANSI SKL.

Google takođe pruža partnerske funkcije kao što su mašinsko učenje, alati za geolokaciju, alati za analitiku i statistiku i pristup korisnika i upravljanje pravima.

BigKueri arhitekturom u potpunosti upravlja Google, što znači da korisnici ne moraju da brinu o stvarima kao što su skalabilnost, raspodela računarske energije, pravljenje rezervnih kopija, održavanje itd. Rešenje je jedinstveno jer njegov dizajn omogućava da primate rezultate zahteva preko terabajta podataka u sekundi i petabajta u minutama.

Ovo vam omogućava da učitate izveštaje i interaktivno filtrirate i sortirate podatke u realnom vremenu.

BigKueri nije samo baza podataka - to je nerelacioni sistem baze podataka za analitičku obradu onlajn optimizovan za čitanje i analizu. Takođe je moguće umetnuti podatke i povezati BK sa spoljnim izvorima podataka.

Njegova ključna svojstva su skalabilnost, pouzdanost, dostupnost, niski operativni troškovi, mogućnosti samopopravke i decentralizovana arhitektura. DVH alternative BK su npr. Amazon Redshift i Microsoft Azure SKL.

Podaci u BK su organizovani u skupove podataka (slično bazi podataka) sastavljene od tabela, prikaza i drugih entiteta kao što su modeli mašinskog učenja. Prava na pristup, uređivanje, brisanje itd. mogu se postaviti za ceo skup podataka ili za pojedinačne tabele koje su njegov deo.

Google Cloud platforma se koristi za upravljanje korisničkim nalozima i korisnici moraju imati aktivan Google nalog da bi radili sa BK. Svim pristupima upravljaju i proveravaju Daktela administratori.

Više informacija možete pronaći na zvaničnom Stranica Google Cloud.

Kvote i ograničenja

Google ograničava maksimalno opterećenje sistema postavljanjem ograničenja i kvota za određeni vremenski period (npr. broj upita, veličina prenesenih podataka itd.) BK je napravljen za velike projekte sa ogromnim količinama podataka i iz perspektive velikih podataka, čak i najveće i najsloženije Daktela PBKS su mali i jednostavan skup podataka.

Saznajte više o kvotama i ograničenjima na zvanična Google stranica.

Google Data Studio

Google Data Studio (DS) je alat za vizuelizaciju i izveštavanje podataka sličan Microsoft Pover BI ili Tableau. To je veb aplikacija sa korisničkim interfejsom gde možete kreirati izveštaje dodavanjem tabela i grafikona i dopunjavati ih tekstualnim i vizuelnim elementima.

Data Studio se može koristiti za:

  • Kreiranje i uređivanje pojedinačnih izveštaja
  • Upravljanje izveštajima kojima korisnik ima pristup
  • Pregled izveštaja
  • Kreiranje, uređivanje i upravljanje izvorima podataka
  • Upravljanje pristupom ovim izveštajima i izvorima podataka

Svaki izveštaj se sastoji od:

  • Izvor podataka
  • Sadržaj
  • Podešavanja pristupa

Više izveštaja može koristiti isti izvor podataka, a izveštaj može koristiti nekoliko različitih izvora podataka.

Prava pristupa se dodeljuju u Google okruženju odvojeno za svaku uslugu:

BigKueri pristupi i prava mogu se podesiti za svaku od njih:

  • Projekat (unutrašnji Daktela pristupi)

Pristupi i prava Data Studio-a mogu se podesiti za svaki:

  • Deljeni izvor podataka

I u BK i u DS-u korisnik vidi samo entitete kojima ima prava pristupa. Oni nemaju načina da saznaju o entitetima drugih korisnika (skupovi podataka, tabele, izvori podataka, izveštaji) dok ne pokušaju da im pristupe putem URL-a.

DataStudio - izvori podataka

Izraz Izvor podataka kolektivno se odnosi na:

  • Postavljena veza sa izvorom podataka
  • Transformacija i formatiranje primljenih podataka
  • Učestalost sinhronizacije podataka
  • Prava pristupa

Sve ove stavke čine Google DS entitet sa kojim korisnik može da radi. Entitet nije izvor podataka, već model podataka ili šema. Takođe ga možete zamisliti kao konektor za izvor podataka, obično DVH.

Google Data studio može da koristi vezu sa izvorom podataka za povezivanje sa različitim vrstama DVH, od Google izvornih (Google BK, Google tabele, Google analitika, Google Ads, Google ankete, Google Cloud itd.) do najčešće korišćenih (Microsoft SKL Server, MiSKL, PostgreSQL, CSV datoteke itd.) do konektora trećih strana. Kompletna lista konektora dostupna je na Gugl veb-sajt.

Povezivanjem izvora podataka kreira se novi entitet. Definiše:

  • Veza sa BigKueri-om ili izvorom podataka
  • Upitana tabela ili SKL specifikacija
  • Oblikovanje dimenzija
  • Agregirane metrike
  • Parametri - obično vremenski period za podatke
  • Pristup - koji korisnici mogu da uređuju izvor podataka i/ili uređuju njegovu definiciju
  • Učestalost sinhronizacije podataka („svežina podataka“) - obično 1 sat, u rasponu od 1 minuta do 12 sati
  • Deljenje izvora podataka - ograničeno na trenutni izveštaj ili dozvoljeno deljenje u više izveštaja

Postoje i drugi načini za sužavanje podataka u izveštaju koji nisu direktno u izvoru podataka. Takođe možete da koristite „kontrole“ i „skrivene filtere“ koji su opisani u nastavku. Takođe je moguće povezati pojedinačne izvore podataka („mešanje podataka“), pružajući složeno agregiranje podataka koje bi inače bilo teško postići korisnicima bez dobrog znanja o SKL.

Svaki zahtev za podatke iz izveštaja preveden je u SKL upit. Njegov rezultat se privremeno čuva (keširuje) za vreme postavljeno u „svežini podataka“, pružajući gotovo trenutno vreme odgovora i niske troškove po upitu.

Vlasnik izveštaja automatski postaje vlasnik izvora podataka koji se kreira u izveštaju. Moguće je dodati zajedničke izvore podataka iz sopstvenih izveštaja u druge izveštaje koje posedujete. Da biste koristili i uređivali izvore podataka u vlasništvu drugih korisnika, potrebno je da zatražite dozvolu vlasnika i oni je moraju odobriti.

Ako uklonite ugrađeni izvor podataka iz izveštaja, on će biti izbrisan. Ako uklonite zajednički izvor podataka iz izveštaja, on neće biti izbrisan.

DataStudio — izveštaji

Nakon što podesite izvor podataka, možete da kreirate izveštaj dodavanjem grafikona gde možete da izaberete dimenziju i/ili metriku iz izvora podataka. Da bi izgled bio što jasniji, možete dodati više stranica izveštaja i dodati druge elemente kao što su tekst i slike.

Polja

Polje je kolona podataka. Postoje 2 različite vrste: dimenzije i metrika. Dimenzije sadrže kategorije ili entitete koje želite da izmerite. Metrika opisuje dimenzije pomoću broja.

Osim polja koja se automatski učitavaju iz izvora podataka, možete kreirati sopstveno polje pomoću:

  • Kombinovanje dimenzija za stvaranje nove dimenzije
  • Kombinovanje metrika jedna sa drugom ili sa dimenzijom za kreiranje nove metrike

Dimenzije

Dimenzija je kategorija informacija ili podataka, tačnije niz podataka. Na primer, prilikom merenja saobraćaja na veb lokaciji, neke dimenzije mogu biti Pregledač, veb stranica, jezik itd. Ako koristite izvor podataka zasnovan na bazi podataka ili tabelama, dimenzija predstavlja kolonu vaše tabele.

U DS-u možete promeniti naslov, tip podataka (tekst, broj, datum itd.) I opis svake dimenzije.

Metrika

Metrika je agregatni proračun ili operacija koja se primenjuje na skup podataka, npr. broj unosa, zbir, maksimum, minimum, prosek itd. Analogna je agregatnoj funkciji u SKL upitu.

Možete kombinovati dimenzije i metrike u svojim grafikonima i tabelama.

Grafikoni

Sledeće su dostupne:

  • Stolovi (redovni i okretni)
  • Grafikoni
  • Tablice rezultata - elementi sa jednom metrikom

Filteri

Filtriranje u DS-u se tumači u pozadini kao uređivanje izvora podataka SKL. Shodno tome, dobićete iste podatke bez obzira da li primenite filter kada podaci uđu u DS (definicija SKL upita) ili na nivou elementa izveštaja (skriveni filter grafikona ili tabele), ili ako osoba koja gleda izveštaj primenjuje filter (korisnički filter = kontrolni element). Filteri će uvek biti prevedeni u SKL upite u BK.

Međutim, brže vreme učitavanja možete postići pravilnom primenom filtera. Preporučuje se definisanje određenog SKL upita za ceo izvor podataka i primanje samo relevantnih podataka umesto da se traži cela tabela i filtrira na nivou izveštaja. Ovo takođe štedi vreme prilikom učitavanja i upravljanja dostupnim komponentama tokom procesa uređivanja izveštaja.

Ostali elementi

Ostali elementi koje možete dodati u svoje izveštaje:

  • Linkovi
  • Slike
  • Spoljni sadržaj - ugrađeni URL
  • Parametri (vremenski period, adresa e-pošte posetioca, sopstveni parametri)

Pošto su izveštaji na određenom URL-u, moguće je ugraditi izveštaje u vaše mrežne dokumente, veb stranice itd.

DataStudio — pristupi

Postoje dve različite vrste pristupa:

  1. Pogledaj
  2. Uredi

Korisnici sa pristupom prikazu ne mogu da izvrše nikakve promene u rasporedu ili podešavanjima izveštaja. Oni mogu samo da komuniciraju sa izveštajem i obično ga izvoze u PDF, odštampaju ga ili kreiraju kopiju (koju zatim mogu urediti, tj. takođe saznati kako je kreiran).

Korisnici sa pristupom uređivanju mogu da uređuju sadržaj izveštaja i menjaju njegova podešavanja. Vlasnik izveštaja može da upravlja drugim svojstvima pristupa, kao što je sprečavanje drugih korisnika da dodaju više korisnika.

Takođe možete dozvoliti pristup pomoću veze. Ovo bi promenilo gore navedeno u:

  1. Deljenje veza isključeno - samo navedeni korisnici će imati pristup
  2. Deljenje veza na - navedeni korisnici imaju pristup, plus:
    • 2.1. Svako u grupi sa vezom može da vidi (npr. samo korisnici u vašoj kompaniji)
    • 2.2. Svako u grupi sa vezom može da uređuje
    • 2.3. Svako sa vezom može da vidi
    • 2.4. Svako sa vezom može da uredi
    • 2.5. Svako na internetu može pronaći izveštaj i pogledati ga (čak i bez veze)
    • 2.6. Svako na internetu može pronaći izveštaj i urediti ga (čak i bez veze)

Ako želite da izbegnete podešavanje različitih nivoa pristupa svojim izveštajima, možete ga podesiti na 2.3 ili 2.5, ali to ne preporučujemo ako vaši izveštaji sadrže osetljive informacije. Nije moguće pregledati određeni saobraćaj izveštaja — Google analitika će prikazivati samo anonimne informacije.

Pristup izvornim podacima opisan je gore.

Da bi pristupio trenutnoj i interaktivnoj verziji izveštaja, korisnik treba da zna ili:

  1. Njen URL, ili
  2. Tačan naslov izveštaja i njegov vlasnik. Po želji, PDF izveštaj može da sadrži vezu do mrežne ili ugrađene verzije izveštaja.

Ako korisnik zna URL izveštaja i ima pristup izveštaju, pregledač će ga prikazati. Ako nemaju pristup, otvoriće se dijaloški okvir koji ih obaveštava da treba da zatraže vlasnika za pristup. Korisnik može da izabere koju vrstu pristupa želi da zatraži. Vlasnik će dobiti obaveštenje i kada odobri pristup, korisnik će moći da otvori izveštaj. Ako korisnik ne zna URL izveštaja, mora da kontaktira vlasnika izveštaja na drugi način. Vlasnik tada mora ručno pronaći izveštaj i omogućiti korisniku pristup njemu.

Izveštaji u PDF-u mogu biti zaštićeni lozinkom, ali se mogu deliti kao i bilo koji drugi tip datoteke. Da bi sprečio neovlašćeno deljenje, vlasnik izveštaja može sprečiti druge korisnike da izvoze izveštaj u PDF. Ovo takođe isključuje štampanje i kopiranje.

Konačno, možete da koristite i distribuirano deljenje izveštaja koristeći periodično poslate automatski generisane e-pošte koje sadrže:

  • link do ažurne verzije izveštaja
  • pregled izveštaja (obično prvih nekoliko stranica)
  • prilog sa PDF kopijom izveštaja sa podacima od dana slanja izveštaja

Krajnji primaoci mogu da proslede e-poštu drugima. Ako bilo koji korisnik nema pristup izveštaju, kada otvori URL izveštaja, moći će da zatraži pristup. Oni će i dalje moći da otvore PDF izveštaj.

Međutim, ovaj metod može biti koristan ako želite da distribuirate izveštaj ljudima izvan vaše organizacije.

Latest articles