Mint már tudod a mi oldalunkról előző blogbejegyzés, a Daktela a jelentéstételi eszközök széles skáláját kínálja. A dolgok egyszerűsítése érdekében úgy gondolhatja, hogy a Daktela-nak két ága van a jelentési és analitikai eszközök:
Bár a Daktela egy összetett webalkalmazás, és robusztus elemző eszközöket tartalmaz, bizonyos esetekben hasznos lehet külső szolgáltatás kiválasztása. Érdemes gondolkodni egy használatára, különösen, ha:
A modern és szuperhatékony Google-megoldás ideális jelölt ezekre a célokra. Ebben a cikkben gyorsan megnézzük.
Általánosságban elmondható, hogy a megoldás az adattárolás (Google BigQuery), a jelentési eszköz (Google Data Studio), az affiliate szolgáltatások (Google Cloud Platform — biztonság, menedzsment, karbantartás, monitoring) és adatáramlások (Daktela) kombinációja, amelyek ETL és BI portfóliót alkotnak.
Egyértelmű előnye, hogy a megoldás webböngészővel érhető el. Nincs szükség dedikált szoftverre; minden elérhető bármely számítógépről, megfelelő jogokkal rendelkező Google-fiókot használó számítógépről. A rendszer működőképessége csak az internetkapcsolat sebességétől függ.
Időszakos feladatok vannak beállítva bigquery.daktela.com amelyek átalakítják az adatokat az PBX-ekből és betöltik azokat BigQuery (BQ) rendszeres időközönként. Ezek az úgynevezett futtatási szkriptek Java-ban vannak írva.
A szinkronizációs időtartam 120 perc és 24 óra. Az adatokat rendszeresen 2 óránként töltik be, és minden nap végén éjfélkor újabb konszolidációs kötet töltenek be az adatok integritásának biztosítása érdekében. A kiválasztott PBX-eken a 2 órás intervallumot 1 órára lehet lerövidíteni.
Elszigetelt esetekben látszólag ismétlődő bejegyzések hozhatók létre a BQ-ban. A futó szkript másolatokat keres, kimenetét figyelik, és értesítéseket küldenek a felügyeleti szoftvernek. A duplikátumok automatikusan eltávolításra kerülnek a napi szinkronizálás során. Ez azt jelenti, hogy semmit sem kell tennie a jelentési adatok naprakészen tartása érdekében.
Mivel a BQ-hoz csatlakoztatott összes projekt futási parancsfájlja fut a bigquery.daktela.com szerver, a tervek szerint különböző időpontokban futnak, így nem versenyeznek egymással, és így a rendszer erőforrásait hatékonyan használják. Ez hozzájárul a viszonylag rövid feldolgozási időhöz is. A szinkronizálási lépés (óránkénti vagy napi tétel betöltése minden projektpéldányhoz) percek és tíz perc kérdése — általában 10-30 perc, szélsőséges esetekben akár 60-90 perc. Hibakereséskor a szinkronizálás manuálisan is elindítható.
Minden szkript szöveges fájlnaplót ad ki.
Hozzáférés a bigquery.daktela.com A kiszolgáló SSH kulccsal van biztosítva. A szervert teljes egészében a Daktela IT rendszergazdák kezelik, akik a felhasználói hozzáférést is kezelik.
A BigQuery egy teljesen felügyelt, szerver nélküli adatraktár (DWH), amely rendkívül nagy mennyiségű adat skálázható elemzését teszi lehetővé (petabájt sorrendben: 1PB ≈ 1024 TB ≈ 1 millió GB). Ez egy platform, mint szolgáltatás, amely támogatja az ANSI SQL használatával történő lekérdezést.
A Google olyan társult funkciókat is biztosít, mint például a gépi tanulás, a földrajzi helymeghatározási eszközök, az elemző és statisztikai eszközök, valamint a felhasználói hozzáférés és a jogok kezelése.
A BigQuery architektúrát teljes egészében a Google kezeli, ami azt jelenti, hogy a felhasználóknak nem kell aggódniuk a méretezhetőség, a számítási energiaelosztás, a biztonsági mentés, a karbantartás stb. A megoldás egyedülálló, mivel kialakítása lehetővé teszi, hogy másodpercek alatt terabájtnál nagyobb adatot kapjon a kérések eredményeit.
Ez lehetővé teszi a jelentések betöltését, valamint az adatok interaktív szűrését és rendezését valós időben.
A BigQuery nem csupán adatbázis, hanem egy nem relációs online analitikai feldolgozó adatbázis-rendszer, amelyet olvasásra és elemzésre optimalizáltak. Lehetőség van adatok beszúrására és a BQ csatlakoztatására külső adatforrásokhoz is.
Főbb tulajdonságai a méretezhetőség, a megbízhatóság, az elérhetőség, az alacsony üzemeltetési költségek, az önjavítási lehetőségek és a decentralizált architektúra. A BQ DWH alternatívái például az Amazon Redshift és a Microsoft Azure SQL.
A BQ adatait táblázatokból, nézetekből és egyéb entitásokból, például gépi tanulási modellekből álló adathalmazokba sorolják (hasonlóan az adatbázishoz). Hozzáférési, szerkesztési, törlési stb. jogok beállíthatók a teljes adatkészletre vagy annak részét képező egyes táblákra vonatkozóan.
A Google Cloud platform felhasználói fiókok kezelésére szolgál, és a felhasználóknak aktív Google-fiókkal kell rendelkezniük a BQ-val való együttműködéshez. Minden hozzáférést a Daktela rendszergazdák kezelik és ellenőrzik.
További információt talál a tisztviselőről Google Cloud oldal.
A Google korlátozza a rendszer maximális terhelését azáltal, hogy korlátokat és kvótákat állít be egy adott időszakra (pl. lekérdezések száma, az átvitt adatok mérete stb.) A BQ nagy projektekhez készült, hatalmas mennyiségű adatmennyiséggel, és a big data szempontból még a legnagyobb és legösszetettebb Daktela PBX-ek is kicsi és egyszerű adatkészlet.
Tudjon meg többet a kvótákról és korlátozásokról hivatalos Google oldal.
A Google Data Studio (DS) a Microsoft Power BI-hez vagy a Tableau-hoz hasonló adatmegjelenítési és jelentési eszköz. Ez egy felhasználóbarát felülettel rendelkező webes alkalmazás, ahol táblázatok és grafikonok hozzáadásával készíthet jelentéseket, és kiegészítheti azokat szöveges és vizuális elemekkel.
A Data Studio a következőkre használható:
Minden jelentés a következőkből áll:
Több jelentés ugyanazt az adatforrást használhatja, és egy jelentés több különböző adatforrást is használhat.
A hozzáférési jogokat a Google környezetben külön biztosítják az egyes szolgáltatásokhoz:
A BigQuery hozzáférések és jogosultságok mindegyikhez beállíthatók:
A Data Studio hozzáférései és jogosultságai mindegyikhez beállíthatók:
Mind a BQ-ban, mind a DS-ben a felhasználó csak azokat az entitásokat látja, amelyekhez hozzáférési joggal rendelkezik. Nem tudják megtudni más felhasználók entitásairól (adatkészletek, táblázatok, adatforrások, jelentések), amíg meg nem próbálják elérni őket egy URL-en keresztül.
Az Adatforrás kifejezés együttesen a következőkre utal:
Mindezek az elemek egy Google DS entitást alkotnak, amellyel a felhasználó dolgozhat. Az entitás nem adatforrás, hanem adatmodell vagy rendszer. Az adatforráshoz, általában DWH-hoz való csatlakozójaként is gondolhatja.
A Google Data Studio az adatforráshoz való kapcsolat segítségével különböző DWH-típusokhoz csatlakozhat, a Google natív (Google BQ, Google Táblázatok, Google Analytics, Google Ads, Google Surveys, Google Cloud stb.) a gyakran használt (Microsoft SQL Server, MySQL, PostgreSQL, CSV fájlok stb.) a harmadik féltől származó csatlakozókig. A csatlakozók teljes listája elérhető a következő oldalon: Google weboldal.
Egy adatforrás összekapcsolásával új entitás jön létre. Meghatározza:
A jelentés adatainak szűkítésének más módjai is vannak, kivéve közvetlenül az adatforrásban. Használhatja az alábbiakban ismertetett „vezérlőket” és „rejtett szűrőket” is. Lehetőség van az egyes adatforrások összekapcsolására is („adatkeverés”), komplex adatgyűjtést biztosítva, amelyet egyébként nehéz lenne elérni a jó SQL-ismeretek nélküli felhasználók számára.
A jelentésből származó minden adatkérés SQL lekérdezésbe kerül lefordításra. Ennek eredménye ideiglenesen mentésre kerül (gyorsítótárazás) az „adatfrissességre” beállított időtartamra, ami szinte azonnali válaszidőt és alacsony lekérdezésenkénti költségeket biztosít.
A jelentés tulajdonosa automatikusan a jelentésben létrehozott adatforrás tulajdonosává válik. Lehetőség van megosztott adatforrásokat saját jelentéseiből hozzáadni más, saját tulajdonában lévő jelentésekhez. Más felhasználók tulajdonában lévő adatforrások használatához és szerkesztéséhez kérnie kell a tulajdonos engedélyét, és nekik meg kell adniuk azt.
Ha eltávolít egy beágyazott adatforrást egy jelentésből, az törlődik. Ha eltávolít egy megosztott adatforrást egy jelentésből, az nem törlődik.
Az adatforrás beállítása után grafikonok hozzáadásával készíthet jelentést, ahol kiválaszthatja a méretet és/vagy mutatókat az adatforrásból. Az elrendezés lehető legvilágosabbá tétele érdekében több jelentési oldalt is hozzáadhat, és más elemeket, például szöveget és képeket is hozzáadhat.
A mező egy adatoszlop. Két különböző típus létezik: méretek és mérőszámok. A méretek olyan kategóriákat vagy entitásokat tartalmaznak, amelyeket mérni szeretne. A mutatók számok segítségével írják le a dimenziókat.
Az adatforrásból automatikusan betöltött mezők mellett saját mezőt hozhat létre az alábbiak szerint:
A dimenzió az információ vagy adat kategóriája, vagy pontosabban egy adattömb. Például a weboldal forgalmának mérésekor bizonyos dimenziók lehetnek Böngésző, Weboldal, Nyelv stb. Ha adatbázis-alapú vagy táblázatalapú adatforrást használ, a méret a tábla oszlopát jelöli.
A DS rendszerben módosíthatja az egyes dimenziók címét, adattípusát (szöveg, szám, dátum stb.) és leírását.
A metrika egy adatkészletre alkalmazott összesített számítás vagy művelet, pl. bejegyzések száma, összeg, maximum, minimum, átlag stb. Analóg egy SQL-lekérdezésben szereplő összesített függvényhez.
Kombinálhatja a dimenziókat és mutatókat grafikonokban és táblázatokban.
A következők állnak rendelkezésre:
A DS-ben történő szűrést a háttérben az adatforrás SQL szerkesztéseként értelmezik. Következésképpen ugyanazokat az adatokat kapja, függetlenül attól, hogy szűrőt alkalmaz a DS-be (az SQL lekérdezés meghatározása) vagy a jelentéselem szintjén (grafikon vagy táblázat rejtett szűrője), vagy ha a jelentést megtekintő személy alkalmazza a szűrőt (felhasználói szűrő = vezérlőelem). A szűrőket mindig SQL lekérdezésekre fordítják a BQ-ban.
A szűrők helyes alkalmazásával azonban gyorsabb betöltési időt érhet el. Ajánlott egy konkrét SQL-lekérdezést meghatározni a teljes adatforráshoz, és csak releváns adatokat kapni ahelyett, hogy a teljes táblázatot kérné és a jelentés szintjén történő szűrést. Ez időt takarít meg a rendelkezésre álló összetevők betöltésekor és kezelésekor a jelentésszerkesztési folyamat során.
További elemek, amelyeket hozzáadhat a jelentésekhez:
Mivel a jelentések egy adott URL-en találhatók, lehetőség van jelentések beágyazására az online dokumentumokba, weboldalakba stb.
Kétféle hozzáférés létezik:
A Nézet-hozzáféréssel rendelkező felhasználók nem tudnak módosítani a jelentés elrendezését vagy beállításait. Csak interakcióba léphetnek a jelentéssel, és általában PDF-be exportálhatják, kinyomtathatják vagy másolatot készíthetnek (amelyet aztán szerkeszthetnek, azaz megtudhatják, hogyan hozták létre).
A Szerkesztési hozzáféréssel rendelkező felhasználók szerkeszthetik a jelentés tartalmát és módosíthatják annak beállításait. A jelentés tulajdonosa kezelhet más hozzáférési tulajdonságokat, például megakadályozhatja, hogy más felhasználók több felhasználót adjanak hozzá.
A hozzáférést hivatkozással is engedélyezheti. Ez a fentieket a következőkre változtatná:
Ha el akarja kerülni a jelentésekhez való hozzáférés különböző szintjeinek beállítását, beállíthatja azt 2.3 vagy 2.5 értékre, de ezt nem javasoljuk, ha jelentései érzékeny információkat tartalmaznak. Konkrét jelentési forgalom megtekintése nem lehetséges — a Google Analytics csak anonimizált információkat jelenít meg.
A forrásadatokhoz való hozzáférést a fentiekben ismertetjük.
A jelentés aktuális és interaktív verziójának eléréséhez a felhasználónak tudnia kell a következőket:
Ha a felhasználó ismeri a jelentés URL-jét, és hozzáférhet a jelentéshez, a böngésző megjeleníti azt. Ha nincs hozzáférésük, megnyílik egy párbeszédpanel, amely tájékoztatja őket arról, hogy hozzáférést kell kérniük a tulajdonostól. A felhasználó kiválaszthatja, hogy milyen típusú hozzáférést szeretne kérni. A tulajdonos értesítést kap, és miután hozzáférést biztosít, a felhasználó képes lesz megnyitni a jelentést. Ha a felhasználó nem ismeri a jelentés URL-jét, más módon kell kapcsolatba lépnie a jelentés tulajdonosával. Ezután a tulajdonosnak manuálisan meg kell találnia a jelentést, és hozzáférést kell biztosítania a felhasználónak hozzá.
A PDF-ben lévő jelentések jelszóval védettek, de minden más fájltípushoz hasonlóan megoszthatók. A jogosulatlan megosztás megakadályozása érdekében a jelentés tulajdonosa megakadályozhatja, hogy más felhasználók exportálják a jelentést PDF-be. Ez kikapcsolja a nyomtatást és a másolást is.
Végül az elosztott jelentésmegosztást is használhatja rendszeresen küldött automatikusan generált e-mailek használatával, amelyek a következőket tartalmazzák:
A végcímzettek továbbíthatják az e-mailt másoknak. Ha bármelyik felhasználó nem fér hozzá a jelentéshez, a jelentés URL-címének megnyitásakor hozzáférést kérhet. Továbbra is képesek lesznek megnyitni a PDF jelentést.
Ez a módszer azonban hasznos lehet, ha a jelentést a szervezeten kívüli személyek számára kell terjesztenie.