Google BigQuery és Google Data Studio jelentések

September 2, 2024

Mint már tudod a mi oldalunkról előző blogbejegyzés, a Daktela a jelentéstételi eszközök széles skáláját kínálja. A dolgok egyszerűsítése érdekében úgy gondolhatja, hogy a Daktela-nak két ága van a jelentési és analitikai eszközök:

  1. A Daktela webalkalmazásban elérhető statisztikák és elemzések
  2. Google megoldás

Bár a Daktela egy összetett webalkalmazás, és robusztus elemző eszközöket tartalmaz, bizonyos esetekben hasznos lehet külső szolgáltatás kiválasztása. Érdemes gondolkodni egy használatára, különösen, ha:

  • Nagy mennyiségű adattal rendelkezik
  • Használjon több PBX-et
  • Asztalokat kell csatlakoztatni
  • Speciális jelentésadat-szűrést szeretne
  • Aggódnak a PBX terhelések miatt
  • Gyorsabb betöltési időt igényel

A modern és szuperhatékony Google-megoldás ideális jelölt ezekre a célokra. Ebben a cikkben gyorsan megnézzük.

Általánosságban elmondható, hogy a megoldás az adattárolás (Google BigQuery), a jelentési eszköz (Google Data Studio), az affiliate szolgáltatások (Google Cloud Platform — biztonság, menedzsment, karbantartás, monitoring) és adatáramlások (Daktela) kombinációja, amelyek ETL és BI portfóliót alkotnak.

Egyértelmű előnye, hogy a megoldás webböngészővel érhető el. Nincs szükség dedikált szoftverre; minden elérhető bármely számítógépről, megfelelő jogokkal rendelkező Google-fiókot használó számítógépről. A rendszer működőképessége csak az internetkapcsolat sebességétől függ.

Daktela — automatikus szinkronizálás

Időszakos feladatok vannak beállítva bigquery.daktela.com amelyek átalakítják az adatokat az PBX-ekből és betöltik azokat BigQuery (BQ) rendszeres időközönként. Ezek az úgynevezett futtatási szkriptek Java-ban vannak írva.

A szinkronizációs időtartam 120 perc és 24 óra. Az adatokat rendszeresen 2 óránként töltik be, és minden nap végén éjfélkor újabb konszolidációs kötet töltenek be az adatok integritásának biztosítása érdekében. A kiválasztott PBX-eken a 2 órás intervallumot 1 órára lehet lerövidíteni.

Elszigetelt esetekben látszólag ismétlődő bejegyzések hozhatók létre a BQ-ban. A futó szkript másolatokat keres, kimenetét figyelik, és értesítéseket küldenek a felügyeleti szoftvernek. A duplikátumok automatikusan eltávolításra kerülnek a napi szinkronizálás során. Ez azt jelenti, hogy semmit sem kell tennie a jelentési adatok naprakészen tartása érdekében.

Mivel a BQ-hoz csatlakoztatott összes projekt futási parancsfájlja fut a bigquery.daktela.com szerver, a tervek szerint különböző időpontokban futnak, így nem versenyeznek egymással, és így a rendszer erőforrásait hatékonyan használják. Ez hozzájárul a viszonylag rövid feldolgozási időhöz is. A szinkronizálási lépés (óránkénti vagy napi tétel betöltése minden projektpéldányhoz) percek és tíz perc kérdése — általában 10-30 perc, szélsőséges esetekben akár 60-90 perc. Hibakereséskor a szinkronizálás manuálisan is elindítható.

Minden szkript szöveges fájlnaplót ad ki.

Hozzáférés a bigquery.daktela.com A kiszolgáló SSH kulccsal van biztosítva. A szervert teljes egészében a Daktela IT rendszergazdák kezelik, akik a felhasználói hozzáférést is kezelik.

Google BigQuery

A BigQuery egy teljesen felügyelt, szerver nélküli adatraktár (DWH), amely rendkívül nagy mennyiségű adat skálázható elemzését teszi lehetővé (petabájt sorrendben: 1PB ≈ 1024 TB ≈ 1 millió GB). Ez egy platform, mint szolgáltatás, amely támogatja az ANSI SQL használatával történő lekérdezést.

A Google olyan társult funkciókat is biztosít, mint például a gépi tanulás, a földrajzi helymeghatározási eszközök, az elemző és statisztikai eszközök, valamint a felhasználói hozzáférés és a jogok kezelése.

A BigQuery architektúrát teljes egészében a Google kezeli, ami azt jelenti, hogy a felhasználóknak nem kell aggódniuk a méretezhetőség, a számítási energiaelosztás, a biztonsági mentés, a karbantartás stb. A megoldás egyedülálló, mivel kialakítása lehetővé teszi, hogy másodpercek alatt terabájtnál nagyobb adatot kapjon a kérések eredményeit.

Ez lehetővé teszi a jelentések betöltését, valamint az adatok interaktív szűrését és rendezését valós időben.

A BigQuery nem csupán adatbázis, hanem egy nem relációs online analitikai feldolgozó adatbázis-rendszer, amelyet olvasásra és elemzésre optimalizáltak. Lehetőség van adatok beszúrására és a BQ csatlakoztatására külső adatforrásokhoz is.

Főbb tulajdonságai a méretezhetőség, a megbízhatóság, az elérhetőség, az alacsony üzemeltetési költségek, az önjavítási lehetőségek és a decentralizált architektúra. A BQ DWH alternatívái például az Amazon Redshift és a Microsoft Azure SQL.

A BQ adatait táblázatokból, nézetekből és egyéb entitásokból, például gépi tanulási modellekből álló adathalmazokba sorolják (hasonlóan az adatbázishoz). Hozzáférési, szerkesztési, törlési stb. jogok beállíthatók a teljes adatkészletre vagy annak részét képező egyes táblákra vonatkozóan.

A Google Cloud platform felhasználói fiókok kezelésére szolgál, és a felhasználóknak aktív Google-fiókkal kell rendelkezniük a BQ-val való együttműködéshez. Minden hozzáférést a Daktela rendszergazdák kezelik és ellenőrzik.

További információt talál a tisztviselőről Google Cloud oldal.

Kvóták és korlátozások

A Google korlátozza a rendszer maximális terhelését azáltal, hogy korlátokat és kvótákat állít be egy adott időszakra (pl. lekérdezések száma, az átvitt adatok mérete stb.) A BQ nagy projektekhez készült, hatalmas mennyiségű adatmennyiséggel, és a big data szempontból még a legnagyobb és legösszetettebb Daktela PBX-ek is kicsi és egyszerű adatkészlet.

Tudjon meg többet a kvótákról és korlátozásokról hivatalos Google oldal.

Google Adatstúdió

A Google Data Studio (DS) a Microsoft Power BI-hez vagy a Tableau-hoz hasonló adatmegjelenítési és jelentési eszköz. Ez egy felhasználóbarát felülettel rendelkező webes alkalmazás, ahol táblázatok és grafikonok hozzáadásával készíthet jelentéseket, és kiegészítheti azokat szöveges és vizuális elemekkel.

A Data Studio a következőkre használható:

  • Egyedi jelentések létrehozása és szerkesztése
  • A felhasználó által hozzáférhető jelentések kezelése
  • Jelentések megtekintése
  • Adatforrások létrehozása, szerkesztése és kezelése
  • Ezekhez a jelentésekhez és adatforrásokhoz való hozzáférés kezelése

Minden jelentés a következőkből áll:

  • Adatforrás
  • Tartalom
  • Hozzáférési beállítások

Több jelentés ugyanazt az adatforrást használhatja, és egy jelentés több különböző adatforrást is használhat.

A hozzáférési jogokat a Google környezetben külön biztosítják az egyes szolgáltatásokhoz:

A BigQuery hozzáférések és jogosultságok mindegyikhez beállíthatók:

  • Projekt (belső Daktela hozzáférések)

A Data Studio hozzáférései és jogosultságai mindegyikhez beállíthatók:

  • Megosztott adatforrás

Mind a BQ-ban, mind a DS-ben a felhasználó csak azokat az entitásokat látja, amelyekhez hozzáférési joggal rendelkezik. Nem tudják megtudni más felhasználók entitásairól (adatkészletek, táblázatok, adatforrások, jelentések), amíg meg nem próbálják elérni őket egy URL-en keresztül.

DataStudio — adatforrások

Az Adatforrás kifejezés együttesen a következőkre utal:

  • Adatforrás-kapcsolat beállítása
  • A fogadott adatok átalakítása és formázása
  • Adatszinkronizálási gyakoriság
  • Hozzáférési jogok

Mindezek az elemek egy Google DS entitást alkotnak, amellyel a felhasználó dolgozhat. Az entitás nem adatforrás, hanem adatmodell vagy rendszer. Az adatforráshoz, általában DWH-hoz való csatlakozójaként is gondolhatja.

A Google Data Studio az adatforráshoz való kapcsolat segítségével különböző DWH-típusokhoz csatlakozhat, a Google natív (Google BQ, Google Táblázatok, Google Analytics, Google Ads, Google Surveys, Google Cloud stb.) a gyakran használt (Microsoft SQL Server, MySQL, PostgreSQL, CSV fájlok stb.) a harmadik féltől származó csatlakozókig. A csatlakozók teljes listája elérhető a következő oldalon: Google weboldal.

Egy adatforrás összekapcsolásával új entitás jön létre. Meghatározza:

  • Csatlakozás a BigQuery-hez vagy egy adatforráshoz
  • Lekérdezett táblázat vagy SQL specifikáció
  • Méretek formázása
  • Összesített mutatók
  • Paraméterek — jellemzően az adatok időtartama
  • Hozzáférés — mely felhasználók szerkeszthetik az adatforrást és/vagy szerkeszthetik annak meghatározását
  • Adatszinkronizálási gyakoriság („adatfrissesség”) — általában 1 óra, 1 perctől 12 óráig terjedő
  • Adatforrás-megosztás — az aktuális jelentésre korlátozódik, vagy engedélyezett megosztás több jelentésben

A jelentés adatainak szűkítésének más módjai is vannak, kivéve közvetlenül az adatforrásban. Használhatja az alábbiakban ismertetett „vezérlőket” és „rejtett szűrőket” is. Lehetőség van az egyes adatforrások összekapcsolására is („adatkeverés”), komplex adatgyűjtést biztosítva, amelyet egyébként nehéz lenne elérni a jó SQL-ismeretek nélküli felhasználók számára.

A jelentésből származó minden adatkérés SQL lekérdezésbe kerül lefordításra. Ennek eredménye ideiglenesen mentésre kerül (gyorsítótárazás) az „adatfrissességre” beállított időtartamra, ami szinte azonnali válaszidőt és alacsony lekérdezésenkénti költségeket biztosít.

A jelentés tulajdonosa automatikusan a jelentésben létrehozott adatforrás tulajdonosává válik. Lehetőség van megosztott adatforrásokat saját jelentéseiből hozzáadni más, saját tulajdonában lévő jelentésekhez. Más felhasználók tulajdonában lévő adatforrások használatához és szerkesztéséhez kérnie kell a tulajdonos engedélyét, és nekik meg kell adniuk azt.

Ha eltávolít egy beágyazott adatforrást egy jelentésből, az törlődik. Ha eltávolít egy megosztott adatforrást egy jelentésből, az nem törlődik.

DataStudio — jelentések

Az adatforrás beállítása után grafikonok hozzáadásával készíthet jelentést, ahol kiválaszthatja a méretet és/vagy mutatókat az adatforrásból. Az elrendezés lehető legvilágosabbá tétele érdekében több jelentési oldalt is hozzáadhat, és más elemeket, például szöveget és képeket is hozzáadhat.

Mezők

A mező egy adatoszlop. Két különböző típus létezik: méretek és mérőszámok. A méretek olyan kategóriákat vagy entitásokat tartalmaznak, amelyeket mérni szeretne. A mutatók számok segítségével írják le a dimenziókat.

Az adatforrásból automatikusan betöltött mezők mellett saját mezőt hozhat létre az alábbiak szerint:

  • A méretek kombinálása új dimenzió létrehozásához
  • A mutatók egymással vagy egy dimenzióval történő kombinálása új mutató létrehozásához

Méretek

A dimenzió az információ vagy adat kategóriája, vagy pontosabban egy adattömb. Például a weboldal forgalmának mérésekor bizonyos dimenziók lehetnek Böngésző, Weboldal, Nyelv stb. Ha adatbázis-alapú vagy táblázatalapú adatforrást használ, a méret a tábla oszlopát jelöli.

A DS rendszerben módosíthatja az egyes dimenziók címét, adattípusát (szöveg, szám, dátum stb.) és leírását.

Metrikák

A metrika egy adatkészletre alkalmazott összesített számítás vagy művelet, pl. bejegyzések száma, összeg, maximum, minimum, átlag stb. Analóg egy SQL-lekérdezésben szereplő összesített függvényhez.

Kombinálhatja a dimenziókat és mutatókat grafikonokban és táblázatokban.

Grafikonok

A következők állnak rendelkezésre:

  • Asztalok (normál és pivot)
  • Diagramok
  • Eredménykártyák — egyetlen metrikával rendelkező elemek

Szűrők

A DS-ben történő szűrést a háttérben az adatforrás SQL szerkesztéseként értelmezik. Következésképpen ugyanazokat az adatokat kapja, függetlenül attól, hogy szűrőt alkalmaz a DS-be (az SQL lekérdezés meghatározása) vagy a jelentéselem szintjén (grafikon vagy táblázat rejtett szűrője), vagy ha a jelentést megtekintő személy alkalmazza a szűrőt (felhasználói szűrő = vezérlőelem). A szűrőket mindig SQL lekérdezésekre fordítják a BQ-ban.

A szűrők helyes alkalmazásával azonban gyorsabb betöltési időt érhet el. Ajánlott egy konkrét SQL-lekérdezést meghatározni a teljes adatforráshoz, és csak releváns adatokat kapni ahelyett, hogy a teljes táblázatot kérné és a jelentés szintjén történő szűrést. Ez időt takarít meg a rendelkezésre álló összetevők betöltésekor és kezelésekor a jelentésszerkesztési folyamat során.

Egyéb elemek

További elemek, amelyeket hozzáadhat a jelentésekhez:

  • Linkek
  • Képek
  • Külső tartalom — beágyazott URL
  • Paraméterek (időtartam, látogatói e-mail cím, saját paraméterek)

Mivel a jelentések egy adott URL-en találhatók, lehetőség van jelentések beágyazására az online dokumentumokba, weboldalakba stb.

DataStudio — hozzáférések

Kétféle hozzáférés létezik:

  1. Nézet
  2. Szerkesztés

A Nézet-hozzáféréssel rendelkező felhasználók nem tudnak módosítani a jelentés elrendezését vagy beállításait. Csak interakcióba léphetnek a jelentéssel, és általában PDF-be exportálhatják, kinyomtathatják vagy másolatot készíthetnek (amelyet aztán szerkeszthetnek, azaz megtudhatják, hogyan hozták létre).

A Szerkesztési hozzáféréssel rendelkező felhasználók szerkeszthetik a jelentés tartalmát és módosíthatják annak beállításait. A jelentés tulajdonosa kezelhet más hozzáférési tulajdonságokat, például megakadályozhatja, hogy más felhasználók több felhasználót adjanak hozzá.

A hozzáférést hivatkozással is engedélyezheti. Ez a fentieket a következőkre változtatná:

  1. A hivatkozások megosztása kikapcsolva - csak a megadott felhasználók férhetnek hozzá
  2. Link megosztás — a megadott felhasználók hozzáférhetnek, plusz:
    • 2.1. Bárki a hivatkozással rendelkező csoport tagjai megtekinthetik (pl. csak az Ön vállalatának felhasználói)
    • 2.2. A hivatkozással rendelkező csoport bárki szerkesztheti
    • 2.3. Bárki, akinek a linkje van, megtekintheti
    • 2.4. Bárki, akinek a linkje van, szerkesztheti
    • 2.5. Bárki az interneten megtalálhatja a jelentést és megtekintheti (még a link nélkül is)
    • 2.6. Bárki az interneten megtalálhatja a jelentést és szerkesztheti (még a link nélkül is)

Ha el akarja kerülni a jelentésekhez való hozzáférés különböző szintjeinek beállítását, beállíthatja azt 2.3 vagy 2.5 értékre, de ezt nem javasoljuk, ha jelentései érzékeny információkat tartalmaznak. Konkrét jelentési forgalom megtekintése nem lehetséges — a Google Analytics csak anonimizált információkat jelenít meg.

A forrásadatokhoz való hozzáférést a fentiekben ismertetjük.

A jelentés aktuális és interaktív verziójának eléréséhez a felhasználónak tudnia kell a következőket:

  1. URL-je, vagy
  2. A jelentés pontos címe és tulajdonosa. Opcionálisan egy PDF-jelentés tartalmazhat linket a jelentés online vagy beágyazott verziójára.

Ha a felhasználó ismeri a jelentés URL-jét, és hozzáférhet a jelentéshez, a böngésző megjeleníti azt. Ha nincs hozzáférésük, megnyílik egy párbeszédpanel, amely tájékoztatja őket arról, hogy hozzáférést kell kérniük a tulajdonostól. A felhasználó kiválaszthatja, hogy milyen típusú hozzáférést szeretne kérni. A tulajdonos értesítést kap, és miután hozzáférést biztosít, a felhasználó képes lesz megnyitni a jelentést. Ha a felhasználó nem ismeri a jelentés URL-jét, más módon kell kapcsolatba lépnie a jelentés tulajdonosával. Ezután a tulajdonosnak manuálisan meg kell találnia a jelentést, és hozzáférést kell biztosítania a felhasználónak hozzá.

A PDF-ben lévő jelentések jelszóval védettek, de minden más fájltípushoz hasonlóan megoszthatók. A jogosulatlan megosztás megakadályozása érdekében a jelentés tulajdonosa megakadályozhatja, hogy más felhasználók exportálják a jelentést PDF-be. Ez kikapcsolja a nyomtatást és a másolást is.

Végül az elosztott jelentésmegosztást is használhatja rendszeresen küldött automatikusan generált e-mailek használatával, amelyek a következőket tartalmazzák:

  • link a jelentés naprakész verziójához
  • jelentés előnézete (általában az első néhány oldal)
  • a jelentés küldésének napjától számított adatokat tartalmazó melléklete a jelentés PDF-másolatával

A végcímzettek továbbíthatják az e-mailt másoknak. Ha bármelyik felhasználó nem fér hozzá a jelentéshez, a jelentés URL-címének megnyitásakor hozzáférést kérhet. Továbbra is képesek lesznek megnyitni a PDF jelentést.

Ez a módszer azonban hasznos lehet, ha a jelentést a szervezeten kívüli személyek számára kell terjesztenie.

Latest articles