- Geminijev alatni set kombinira stabilne alate poput Canvasa, Deep Researcha i Guided Learninga s eksperimentalnim značajkama Labsa.
- Gemini API otključava multimodalne i funkcionalne tijekove rada u Google Workspaceu i prilagođenim automatizacijama.
- Vođeno učenje, Canvas i agenti čine Geminija i osobnim tutorom i radnim asistentom za dokumente, slajdove i e-poštu.
- Korištenje integracije Labsa, Gemini Enterprisea i Workspacea omogućuje timovima sigurno testiranje moćne umjetne inteligencije na vlastitim podacima.

„Gemini alatni set“ više nije samo privlačna fraza; to je praktičan skup aplikacija, alata, agenata i API-ja koje Google tiho ugrađuje u sve, od povremenog učenja do poslovnih tijekova rada. Umjesto jednog monolitnog asistenta, Gemini se sada ponaša više kao kutija s alatima gdje je svaka značajka specifičan instrument: istraživački mehanizam, tutor, pomoćnik u kodu, planer sastanaka, alat za izradu slajdova i još mnogo toga.
Ako razumijete kako se ovi dijelovi uklapaju – Canvas, Guided Learning, Labs, agenti, Gemini Enterprise i Gemini API – možete pretvoriti Gemini u pravog radnog konja umjesto neobičnog chatbota. U nastavku ćete pronaći detaljan pregled ovog alatnog paketa: što se nalazi u stabilnom području "Alati", što se testira u "Laboratorijima", kako se Gemini ponaša kao tutorski program sa slikama i videozapisima te kako programeri mogu povezati API s Google Workspaceom za ozbiljnu automatizaciju.
Što se točno danas nalazi u Gemini alatima?
Gemini se najbolje može shvatiti kao obitelj AI modela (što su jezični modeli) (Gemini 1.0, Gemini 1.5, Gemini 3 i tako dalje) isporučuje se putem različitih front-endova: weba, mobilnih aplikacija, integracije Workspacea i API-ja za razvojne programere. Ideja „kutije s alatima“ dolazi iz načina na koji Google sada grupira konkretne mogućnosti unutar Gemini sučelja, posebno na webu.
Na webu je glavni birač unutar Geminija podijeljen u dvije glavne zone: „Alati“ za stabilne, produkcijski spremne funkcionalnosti i „Laboratoriji“ za eksperimente koji su još uvijek u razvoju. Zamislite "Alate" kao pouzdani odvijač koji uzimate svaki dan, dok je "Laboratoriji" ladica u kojoj držite prototipove koji bi sljedeći tjedan mogli promijeniti oblik.
Na mobilnim uređajima, Gemini aplikacije dodaju mnoge od istih alata – vođeno učenje, iskustva slična Canvasu, pomoć bogatu slikama – ali se uvode postupno. Ako još ne vidite određenu značajku u aplikaciji, Google izričito preporučuje da pokušate ponovno kasnije ili da prijeđete na gemini.google.com kako biste vidjeli najnoviju verziju na webu.
Ispod haube, sve ove površine podržava Gemini API, koji otkriva multimodalne modele i pozivanje funkcija tako da možete generirati sadržaj, analizirati slike ili orkestrirati tijekove rada putem koda. Taj API je okosnica mnogih automatizacija radnog prostora koje ćemo kasnije obraditi.
Alati vs. Laboratoriji: kako Gemini organizira svoje značajke
Kako je Gemini akumulirao više gumba i načina rada, Google je uveo jasniju podjelu između zrelih i eksperimentalnih značajki kroz dva odjeljka: "Alati" i "Laboratoriji". Ova promjena je već vidljiva na web sučelju i postupno se implementira s Googleovih poslužitelja, tako da se ne prikazuje isti izgled na svakom računu u isto vrijeme.
Odjeljak "Alati" je mjesto gdje Google parkira mogućnosti koje smatra stabilnima i predvidljivima za svakodnevnu upotrebu. Izvješća iz izvora poput Android Police i 9to5Google pokazuju da ovo područje uključuje stavke poput dubokog istraživanja, generiranja slika, izrade videa putem Veo, Canvas, vođenog učenja i dubokog razmišljanja, ponekad vezane uz određene pretplatničke razine poput Google AI Pro ili Google AI Ultra.
„Labs“, s druge strane, je eksplicitno igralište: namjensko područje unutar Gemini birača koje grupira značajke označene kao eksperimentalne. Obično ćete vidjeti ikone s malom laboratorijskom tikvicom i oznakama poput Gemini Agent, Dynamic View (također se naziva Visual layout) i Personal Intelligence. Očekivanje kada kliknete bilo što pod Labs je jednostavno: ponašanje se može promijeniti, nestati ili pomaknuti uz malo upozorenja.
S gledišta dizajna proizvoda, ova odvojenost je važna za povjerenje. Kada AI aplikacija brzo raste, rizik nije samo „previše značajki“ već „nemam pojma na koje se značajke mogu osloniti“. Stavljanjem svakodnevnih alata u jednu zonu, a eksperimenata u drugu, Gemini signalizira rizik na način sličan „normalnom“ i „sportskom“ načinu rada u automobilu.
Stabilni Gemini alati: Deep Research, Canvas, Guided Learning i još mnogo toga
Osnovni Gemini alati za većinu korisnika nalaze se pod "Alatima", gdje ćete pronaći iskustva oko kojih Google želi da izgradite navike. Iako se točan popis razlikuje ovisno o računu i razini pretplate, nekoliko elemenata je već ključno.
Deep Research transformira Gemini u strukturiranog istraživačkog asistenta, a ne u generički model za chat. Kada postavite pitanje koje zahtijeva pretraživanje više izvora, Deep Research slijedi eksplicitniji višekoračni proces, izvlačeći dosljednu metodologiju kako bi korisnici znali što mogu očekivati svaki put kada je pozovu.
Alati za izradu sadržaja za slike i videozapise – uključujući integracije koje pokreće Veo – također se nalaze u ladici Alati. Korisnici koji se oslanjaju na Gemini za vizualni sadržaj trebaju da te mogućnosti budu lako dostupne i razumno stabilne, a ne skrivene iza promjenjivih eksperimentalnih zastavica.
Canvas je još jedan stup: način rada radnog prostora u kojem možete pokrenuti dokument ili projekt kodiranja izravno iz prompta, a zatim ga iterativno usavršavati pomoću Geminija. Ispod trake zahtjeva možete odabrati "Platno" i upisati upit za generiranje početne točke za sadržaj ili kod, a zatim nastaviti uređivati u interaktivnom rasporedu jedan pored drugog.
Vođeno učenje i duboko razmišljanje zaokružuju kognitivno usmjerenije alate, posebno za korisnike koji žele strukturiranu pomoć sa složenim temama. Vođeno učenje može se ponašati poput tutora, korak po korak vas vodeći kroz ideje, dok duboko razmišljanje potiče sporije, promišljenije razmišljanje o izazovnim pitanjima.
Blizanci kao osobni učitelj: Vođeno učenje, slike i videozapisi
Jedan od najprilagođenijih aspekata Gemini alata je njegova sposobnost da djeluje kao privatni učitelj, kombinirajući vođene sekvence s vizualnim objašnjenjima. Umjesto zatrpavanja tekstom, Gemini može u svoje odgovore uključiti slike, skice, pa čak i videozapise kako bi koncepte bilo lakše razumjeti.
U praktičnom smislu, možete zamoliti Blizance da vam objasne temu i izričito zatražiti dijagram, vizualni prikaz ili ilustrativnu sliku. Odgovor može ugraditi te slike izravno u objašnjenje, pomažući vam da vizualizirate, recimo, matematički koncept, tijek rada ili znanstveni proces.
Podržano je i učenje putem videa, iako se detalji razlikuju ovisno o regiji i fazi uvođenja. Za neke teme, Gemini može prikazati ili referencirati videozapise koji nadopunjuju njegov tekstualni odgovor, stvarajući multimodalniji put učenja gdje čitate, gledate i komunicirate s pitanjima u istom toku.
Ovaj način podučavanja postupno se uvodi u mobilne Gemini aplikacije, tako da možda nećete odmah vidjeti sve opcije. Kada se to dogodi, rezervna opcija je korištenje web iskustva, gdje se Geminijev skup značajki često pojavljuje ranije tijekom postupnih uvođenja.
Gemini Enterprise i Workspace: AI agenti za timove
Osim osobne upotrebe, Gemini alati se proširuju i na radno mjesto putem integracija Gemini Enterprise i Google Workspace. Ovdje se fokus prebacuje s jednokratnih uputa na trajne agente, tijekove rada i suradnju u velikim razmjerima.
Google opisuje Gemini Enterprise kao naprednu agentsku platformu koja svakom zaposleniku i tijeku rada donosi najbolje od Googleove umjetne inteligencije. U praksi, to omogućuje timovima otkrivanje, stvaranje, dijeljenje i pokretanje AI agenata u sigurnom okruženju potkrijepljenom vlastitim podacima tvrtke, smanjujući uska grla u razvoju i omogućujući slučajeve upotrebe poput analize prodaje, automatizacije procesa i internog pretraživanja znanja.
Sam Google Workspace djeluje kao platforma za suradnju koju dodatno nadograđuje Gemini, s umjetnom inteligencijom utkanom u aplikacije poput Gmaila, Dokumenata i Meeta. Umjesto prelaska na zaseban AI alat, korisnici mogu prizvati Gemini unutar svojih svakodnevnih aplikacija za produktivnost kako bi izradili sadržaj, saželi informacije ili generirali ideje u kontekstu.
U nekim postavkama možete čak i izravno razgovarati s Geminijem putem podataka tvrtke pohranjenih u Google Workspaceu, Microsoftu 365 i drugim povezanim sustavima. To Gemini pretvara u sloj korporativnog znanja koji može odgovarati na pitanja na temelju e-pošte, dokumenata i datoteka, ovisno o dopuštenjima i sigurnosnim postavkama koje je konfigurirao IT.
Gemini API: okosnica alata za razvojne programere
Ispod Gemini aplikacija usmjerenih prema korisnicima nalazi se Gemini API, koji pruža iste osnovne modele programerima za ugradnju u vlastite aplikacije. Ovaj API je mjesto gdje se multimodalnost, pozivanje funkcija i prilagođeni tijekovi rada spajaju za ozbiljnu automatizaciju, posebno s Google Workspaceom i Apps Scriptom.
Gemini modeli su Googleovi najmoćniji AI sustavi, a API pruža različite varijante modela - poput verzija usmjerenih na tekst i verzija usmjerenih na vid - svaka sa specifičnim mogućnostima i ograničenjima. Možete ih vizualno istražiti u Google AI Studiju, hostiranom sučelju za isprobavanje upita, podešavanje postavki modela, pa čak i podešavanje prilagođenih modela bez pisanja koda.
Za početak korištenja API-ja, zatražite API ključ putem Google AI Studija ili neke druge podržane konzole, a zatim ga testirajte jednostavnim REST pozivom. Na primjer, možete izvesti svoj ključ u varijablu okruženja poput GOOGLE_API_KEY i pozvati krajnju točku koja navodi dostupne modele, primajući JSON kao što je modeli/gemini-1.0-pro ako je sve ispravno konfigurirano.
Odatle, generiranje sadržaja svodi se na slanje JSON sadržaja odgovarajućoj krajnjoj točki, kao što je generiraj sadržaj metoda za odabrani model. Minimalni zahtjev uključuje sadržaj polje s tekstualnim dijelovima, dok je opcionalno Konfiguracija generacije i Sigurnosne postavke omogućuju vam kontrolu parametara poput temperature i sigurnosnih filtera.
Pozivanje Gemini API-ja iz Apps Scripta
Jedan od najmoćnijih obrazaca u Gemini alatima je kombiniranje API-ja s Google Apps Script-om za automatizaciju tijeka rada unutar Workspacea. Ovaj pristup vam omogućuje orkestriranje Geminija uz usluge poput Drivea, Kalendara, Gmaila, Tablica i Slajdova bez izgradnje potpunog backenda.
Standardna postavka započinje s projektom Apps Script (na primjer, kreiranim putem script.new) gdje pohranjujete svoj Gemini API ključ kao svojstvo skripte. U kodu dohvaćate tu vrijednost i konstruirate URL krajnje točke za određeni model, često gemini-1.0-pro-latest:generirajSadržaj s vašim API ključem proslijeđenim kao parametrom upita.
Pomoćna funkcija kao što je pozivBlizanci(prompt, temperatura) obično izrađuje JSON korisni teret, šalje ga putem UrlFetchApp.fetch i analizira odgovor kako bi izdvojio generirani tekst. Ovaj omotač pojednostavljuje ponovljenu upotrebu API-ja iz različitih uslužnih programa u vašem skriptu.
Testiranje je jednostavno: možete stvoriti testGemini() funkcija koja definira prompt, poziva vašeg pomoćnika i zapisuje i ulaz i izlaz u zapisnike izvršavanja. Nakon što to uspije, znat ćete da su vaše Apps Script okruženje i Gemini API ključ ispravno povezani za naprednije scenarije.
Korištenje krajnje točke Gemini Vision za slike
Gemini alatni okvir nadilazi tekst zahvaljujući multimodalnoj podršci, posebno mogućnosti obrade slika putem krajnje točke s omogućenim vidom. U Apps Scriptu, ovo je obično zasebna krajnja točka kao što je gemini-1.0-pro-vision-latest:generirajSadržaj, opet parametrizirano vašim API ključem.
Tipičan pomagač poput pozivGeminiProVision(upit, slika, temperatura) pretvorit će blob slike u base64, ugraditi ga kao inlineData s odgovarajućim MIME tipom i poslati ga zajedno s tekstualnim upitom. Model zatim vraća tekst koji odražava njegovo razumijevanje i slike i upita.
Za provjeru postavki, možete napisati mali testGeminiVision() koji preuzima uzorak slike s javne URL adrese, prosljeđuje je vašem pomagaču i bilježi zabavnu činjenicu ili analizu koju je izradio Gemini Vision. Ova vrsta testa pokazuje da multimodalni unos ispravno funkcionira u vašem okruženju.
Nakon što se tok vida stabilizira, možete ga ponovno upotrijebiti unutar automatizacija više razine, kao što je analiza grafikona iz Google tablica ili slika pohranjenih na Disku. Tu se multimodalnost počinje činiti kao istinski koristan dio alata, a ne kao demonstracijski trik.
Pozivanje funkcija: davanje Gemini pristupa alatima
Još jedan ključni element Gemini alatnog okvira je pozivanje funkcija, što modelu omogućuje da odluči kada će pozvati vlastite alate ili API-je. Umjesto samog generiranja teksta, Gemini može vratiti strukturirani poziv funkcije objekti koji opisuju koju funkciju koristiti i s kojim argumentima.
U Apps Scriptu možete postaviti pomoćnika kao što je pozoviteGeminiWithTools(upit, alati, temperatura) koji šalje alat specifikaciju zajedno s korisničkim upitom. Ova specifikacija slijedi Deklaracija funkcije shemu, gdje opisujete naziv funkcije, svrhu i JSON parametre.
Kada Gemini odluči da se alat treba koristiti, njegov odgovor uključuje objekt poziva funkcije koji možete parsirati u svom skriptu i usmjeriti do stvarne implementacije. Na primjer, možete definirati alat za razdvajanje pod nazivom "datetime" koji vraća trenutni datum i vrijeme i promatrati kako Gemini zahtijeva tu funkciju za rješavanje pitanja vezanih uz izračune kalendara.
Pozivanje funkcija je posebno moćno jer može raditi kroz više poteza, ne samo kroz pojedinačne zahtjeve. To znači da možete dizajnirati složenije, konverzacijske agente koji odlučuju kada pozvati alate, interpretirati rezultate i nastaviti dijalog.
Demo integracije: Gemini + Google Workspace kao praktičan set alata
Nakon što kombinirate generiranje teksta, vizualni unos i pozivanje funkcija, Gemini alatni okvir postaje praktičan mehanizam za automatizaciju radnog prostora. Googleov materijal za kodni laboratorij opisuje nekoliko konkretnih primjera koji ilustriraju što je moguće.
Na visokoj razini, dolazni korisnički upiti prosljeđuju se Geminiju s nizom dostupnih alata koji predstavljaju različite tijekove rada: zakazivanje sastanaka, izrada e-pošte iz grafikona i stvaranje slajdova. Na temelju upita, Gemini odabire odgovarajuću funkciju i vraća poziv funkcije sa strukturiranim argumentima kao što su vremena, nazivi datoteka ili teme.
U svom Apps Scriptu zatim interpretirate poziv funkcije unutar ako…inače lanac, pozivajući odgovarajući tijek rada – na primjer, postavljanjeSastanka(), nacrtE-pošte() or createDeck(). Ova kombinacija modelnog zaključivanja i eksplicitne logike skripte pretvara Gemini iz prozora za chat u alat za pravi rad.
Automatizacija sastanaka: sažimanje datoteka s Diska u događaje u Kalendaru
Jedna demonstracija pokazuje kako Gemini može pomoći u postavljanju sastanka u Kalendaru koji automatski uključuje sažetak tekstualne datoteke smještene na Google disku. Korisnik bi mogao upisati nešto poput: „Dogovori sastanak sutra u 10 sati s Helen kako bismo razgovarali o novostima iz datoteke Gemini-blog.txt.“
Iza kulisa, alat radnog prostora pod nazivom „setupMeeting“ deklariran je u specifikaciji alata, s parametrima za vrijeme, primatelja i naziv datoteke. Kada Gemini interpretira upit, odabire ovaj alat i vraća poziv funkcije s tim popunjenim argumentima.
Odgovarajući postavljanjeSastanka() funkcija zatim pronalazi navedenu datoteku na Disku, čita njezin sadržaj i prosljeđuje ga Geminiju putem pozivBlizanci() s uputama za izradu kratkog JSON objekta koji sadrži naslov i kratak sažetak. Odgovor se može vratiti omotan ogradama za formatiranje koje uklanjate prije parsiranja kao JSON.
Koristeći izdvojeni naslov i sažetak, skripta stvara događaj u Kalendaru koristeći Kalendar, postavlja opis sažetka i prilaže izvornu datoteku putem napredne usluge Kalendar. Rezultat je zakazani sastanak s ugrađenim kontekstom, a sve je pokrenuto jednim zahtjevom na prirodnom jeziku.
Izrada e-poruka iz grafikona u Tablicama pomoću Gemini Visiona
Drugi tijek rada u Gemini alatima uključuje analizu grafikona u Google tablicama i izradu Gmail poruke na temelju njega. Zamislite da vodite proračunsku tablicu s troškovima fakulteta i želite e-poruku koja sažima što tablica prikazuje za kolegicu po imenu Marija.
Korisnički upit bi mogao glasiti: „Napišite e-poruku za Mariju s uvidima iz grafikona na listu Troškovi fakulteta.“ Alat pod nazivom „draftEmail“ definiran je za prihvaćanje naziva_sheeta i primatelja, a Gemini odabire taj alat kada vidi ovu vrstu zahtjeva.
The nacrtE-pošte() Funkcija pronalazi traženu proračunsku tablicu na Disku, otvara odgovarajući list, dohvaća njegov prvi grafikon i sprema taj grafikon kao datoteku (na primjer, ExpenseChart.png). Zatim izrađuje uputu koja upućuje Gemini da koristi samo informacije iz grafikona, izbjegava povijesne usporedbe i da poruka bude sažeta.
Pozivom pozivGeminiProVision(prompt, grafikon troškova), skripta šalje i upit i sliku grafikona tvrtki Gemini Vision, koja vraća prilagođeno tijelo e-pošte. Konačno, skripta stvara Gmail skicu adresiranu na e-poštu primatelja, postavlja predmet poput "Troškovi fakulteta" i prilaže sliku grafikona.
Ovaj obrazac učinkovito pretvara Blizance u analitičara koji može pročitati grafikon, izdvojiti ključnu priču i formulirati je prirodnim jezikom u vaše ime. I dalje pregledavate i prilagođavate nacrt, ali većina teškog posla obavlja se automatski.
Automatska izrada slajdova pomoću Geminija i Google Slides
Treći glavni demo tijek rada u ovom alatnom okviru automatski izrađuje kosturnu prezentaciju Google Slides na temu koju odredi korisnik. Na primjer, mogli biste pitati: „Pomozite mi sastaviti prezentaciju o očuvanju vode.“
Alat pod nazivom „createDeck“ deklariran je s jednim parametrom, temom, a Gemini je zadužen za vraćanje strukturiranog JSON-a koji opisuje niz slajdova. Prompt govori Gemini koliko slajdova treba stvoriti (na temelju konstante poput NUM_SLIDES), traži kratke naslove i grafičke oznake te eksplicitno traži valjani JSON objekt kako bi ga skripta mogla sigurno analizirati.
Nakon poziva pozivBlizanci() S tim upitom, skripta uklanja sve ograde za formatiranje, analizira JSON i zatim koristi Slajdovi za generiranje nove prezentacije. Prvi slajd se tretira kao naslovna stranica, a sljedeći slajdovi slijede raspored TITLE_AND_BODY gdje skripta popunjava naslov i tekst grafičkih oznaka.
U roku od nekoliko sekundi dobit ćete osnovni prezentacijski paket sa strukturiranim točkama za razgovor po slajdu, spreman za vizualno prilagođavanje. Iako je izlaz namjerno minimalan, ovaj tijek rada pokazuje kako Gemini može ubrzati strukturiranje sadržaja tako da se vi možete usredotočiti na dizajn i nijanse.
Proširenje alata: chatbotovi, RAG i višeokretni alati
Gornji primjeri su samo početna točka; širi Gemini alatni skup može se proširiti u mnogim smjerovima nakon što se upoznate s API-jem i pozivanjem funkcija. Google eksplicitno predlaže nekoliko načina za istraživanje.
Jedan popularan slučaj upotrebe je izrada chatbotova za Google Chat pomoću Gemini API-ja. Ovdje se primjenjuju isti obrasci: izložite alate, pustite Gemini da odluči kada će ih pozvati i povežete odgovore natrag u konverzacijsko sučelje unutar Chata, a sve to regulirano Chat API-jem i pridruženim laboratorijima za kodiranje.
Drugi važan smjer je generiranje prošireno pronalaženjem (RAG) uz privatni sadržaj na Disku ili Keepu. Umjesto sažimanja jedne tekstualne datoteke, možete kombinirati Gemini API s vektorskom bazom podataka i, opcionalno, okvirom za orkestraciju poput LangChaina kako biste dohvatili relevantne isječke iz PDF-ova, slika i bilješki prije nego što zatražite od Geminija da generira odgovor utemeljen na tim dokumentima.
Višestruko pozivanje funkcija također otključava sofisticiranije agente koji mogu iterativno odlučivati koje alate koristiti i kojim redoslijedom. Umjesto jedne odluke, agent može pozvati funkciju, ispitati rezultat, zatim pozvati drugu funkciju ili postaviti pojašnjenje, sve unutar jedne tekuće niti.
Konačno, nema potrebe da ostanete unutar Workspacea; nakon što savladate obrasce Gemini API-ja, možete povezati model s vanjskim API-jima na širem webu. Tako Gemini prelazi iz ograničenog korporativnog asistenta u općeg orkestratora digitalnog rada.
Zajedno, ovi dijelovi – stabilni alati, eksperimentalni laboratoriji, značajke podučavanja, poslovni agenti i API za razvojne programere – čine uistinu bogat Gemini alatni paket koji se može prilagoditi i povremenim učenicima i naprednim korisnicima. Ako Gemini tretirate manje kao jednu aplikaciju, a više kao rastući skup instrumenata koje možete skladati, bit ćete u snažnoj poziciji da iskoristite sve što Google sljedeće doda, a da ne morate svaki put preispitati cijeli svoj tijek rada.
Inženjer. Ljubitelj tehnologije, softvera i hardvera i tehnološki bloger od 2012
