Obsah:
- Krok 1: Nastavte úložný priestor Google Cloud Storage
- Krok 2: Formátujte údaje a vytvorte súbor údajov Csv
- Krok 3: Nahrajte svoje spektrogramy do svojho vedra
- Krok 4: Nahrajte svoju množinu údajov Csv
- Krok 5: Vytvorte množinu údajov
- Krok 6: Vytvorte si svoj model AutoML
- Krok 7: Otestujte si svoj model
- Krok 8: Nainštalujte svoj model do ThinkBioT
Video: Časť 2. Model ThinkBioT s Google AutoML: 8 krokov
2025 Autor: John Day | [email protected]. Naposledy zmenené: 2025-01-13 06:58
ThinkBioT je navrhnutý tak, aby bol „Plug and Play“, s modelmi TensorFlow Lite kompatibilnými s Edge TPU.
V tejto dokumentácii sa budeme zaoberať vytváraním spektrogramov, formátovaním vašich údajov a používaním služby Google AutoML.
Kód v tomto návode bude napísaný v bash, takže bude kompatibilný s viacerými platformami.
Závislosti
- Pred začiatkom však budete musieť nainštalovať Sox zvukový program príkazového riadka kompatibilný so zariadeniami Windows, Mac a Linux.
- Ak používate zariadenie so systémom Windows, najľahší spôsob spustenia skriptov bash je prostredníctvom Gitu, preto by som to odporučil a stiahnuť a nainštalovať ako užitočné v mnohých ohľadoch,
- Na úpravu kódu použite svoj obľúbený editor alebo si nainštalujte NotePad ++ pre Windows alebo Atom pre ostatné operačné systémy.
** Ak máte existujúci model TensorFlow alebo by ste si chceli vyskúšať prenosové učenie s existujúcim modelom, prečítajte si dokumentáciu Google Coral.
Krok 1: Nastavte úložný priestor Google Cloud Storage
1. Prihláste sa do svojho účtu v službe Gmail (alebo si ho vytvorte, ak účet Google nemáte)
2. Prejdite na stránku výberu projektu a vytvorte nový projekt pre svoje modelové a spektrogramové súbory. Ak chcete pokračovať, bude potrebné povoliť fakturáciu.
3. Navštívte stránku https://cloud.google.com/storage/ a stlačte tlačidlo Vytvoriť vedro v hornej časti stránky.
4. Zadajte požadovaný názov vedra a vytvorte vedro tak, aby akceptovalo predvolené nastavenia.
Krok 2: Formátujte údaje a vytvorte súbor údajov Csv
Navrhol som užitočný skript na vytvorenie súboru dataset.csv potrebného na vytvorenie modelu. Súbor množiny údajov spája obrázky vo vašom vedre s ich štítkami v množine údajov.
1. Stiahnite si úložisko ThinkBioT z GitHub a
2. Skopírujte súbor tbt_spect_example.sh z adresára Nástroje do nového priečinka na pracovnej ploche.
3. Pridajte zvukové súbory, ktoré by ste chceli použiť vo svojom modeli, a vložte ich do priečinkov s ich štítkom (tj. Do čoho by ste ich chceli zaradiť. Ak by ste napríklad chceli identifikovať psy alebo mačky, mohli by ste mať priečinok pes, so zvukmi kôry ALEBO priečinok s názvom mačka so zvukmi mačiek atď.
4. Otvorte súbor tbt_spect_example.sh pomocou programu Poznámkový blok ++ a v riadku 54 nahraďte názov „yourbucknamename“názvom úložného priestoru Google. Ak by sa napríklad váš vedro volal myModelBucket, riadok by sa zmenil na
vedro = "gs: // myModelBucket/spectro-data/"
5. Spustite kód zadaním nasledujúceho príkazu do terminálu Bash, kód sa spustí a vytvorí na vašom stole csv súbor štítkov a adresár nazývaný spektro-dáta s výslednými spektrogramami.
sh tbt_spect_example.sh
Krok 3: Nahrajte svoje spektrogramy do svojho vedra
Existuje niekoľko spôsobov, ako nahrať do úložiska Google, najľahšie je načítať priečinok priamo;
1. Kliknite na názov svojho vedra na stránke Úložisko Google.
2. Vyberte tlačidlo „UPLOAD FOLDER“a zvoľte priečinok „spectro-data/“vytvorený v poslednom kroku.
ALEBO
2. Ak máte veľké množstvo súborov, môžete ručne vytvoriť adresár „spectro-data/“výberom „VYTVORIŤ ZLOŽKU“, potom prejdite do priečinka a zvoľte „NAKLADAŤ SÚBORY“. To môže byť skvelá voľba pre veľké množiny údajov, pretože spektrogramy môžete odosielať po častiach, dokonca aj na zvýšenie rýchlosti odosielania pomocou viacerých počítačov.
ALEBO
2. Ak ste pokročilý používateľ, môžete tiež nahrávať prostredníctvom služby Google Cloud Shell;
gsutil cp spectro-data/* gs: // your-bucket-name/spectro-data/
Teraz by ste mali mať vedro plné pekne pekných spektrogramov!
Krok 4: Nahrajte svoju množinu údajov Csv
Teraz musíme nahrať súbor model-labels.csv do vášho adresára „spectro-data/“v úložisku Google, je to v zásade to isté ako v poslednom kroku, iba sťahujete jeden súbor namiesto mnohých.
1. Kliknite na názov svojho vedra na stránke Úložisko Google.
2. Kliknite na tlačidlo „UPLOAD FILE“a vyberte súbor modelu-labels.csv, ktorý ste vytvorili predtým.
Krok 5: Vytvorte množinu údajov
1. Najprv budete musieť nájsť AutoML VIsion API, môže to byť trochu zložité! Najjednoduchším spôsobom je vyhľadať výraz „automl vision“vo vyhľadávacom paneli v úložisku Google Cloud (na obrázku).
2. Po kliknutí na odkaz API budete musieť API povoliť.
3. Teraz sa nachádzate na hlavnom paneli AutoML Vision (na obrázku) kliknite na tlačidlo novej množiny údajov, vyberte položku Single label a možnosť „Select a CSV file“. Potom zahrniete odkaz na svoj súbor model-labels.csv do vedra úložiska. Ak ste sa riadili týmto návodom, bude to nasledovné
gs: //yourBucketName/spectro-data/model-labelsBal.csv
4. Potom stlačením tlačidla Pokračovať vytvorte súbor údajov. Vytvorenie môže chvíľu trvať.
Krok 6: Vytvorte si svoj model AutoML
Hneď ako dostanete e -mail s oznámením, že bol vytvorený váš súbor údajov, ste pripravení vytvoriť nový model.
- Stlačte tlačidlo VLAK
- Vyberte typ modelu: Odhady latencie Edge a Model: Edge TPU a ostatné možnosti ponechajte na začiatku ako predvolené, ťažké by ste však mohli experimentovať neskôr.
- Teraz bude váš model trénovať, chvíľu to potrvá a dostanete e -mail, keď bude pripravený na stiahnutie.
Poznámka: Ak tlačidlo Trénovať nie je k dispozícii, môžete mať problémy s vašou množinou údajov. Ak máte menej ako 10 z každej triedy (štítku), systém vám nedovolí vycvičiť modelku, takže budete musieť pridať ďalšie obrázky. Ak potrebujete objasnenie, stojí za to sa pozrieť na video Google AutoML.
Krok 7: Otestujte si svoj model
Keď dostanete e -mail o dokončení modelu, kliknutím na odkaz sa vrátite do rozhrania AutoML Vision API.
1. Teraz si budete môcť pozrieť svoje výsledky a maticu zmätkov pre váš model.
2. Ďalším krokom je testovanie vášho modelu, prejdite na „TEST & USE“alebo „PREDICT“, podivne sa zdá, že existujú 2 používateľské rozhrania GUI, obe som si predstavil, ale obe možnosti majú rovnakú funkcionalitu.
3. Teraz môžete nahrať testovací spektrogram. Na vytvorenie jedného spektrogramu môžete použiť program tbt_make_one_spect.sh z ThinkBioT Github. Jednoducho ho vložte do priečinka s vlnou, ktorú chcete previesť na spektrogram, otvorte okno (alebo terminál) Git Bash a pomocou nižšie uvedeného kódu nahraďte názov súboru.
sh tbt_make_one_spect.sh yourWavName.wav
4. Teraz jednoducho nahrajte spektrogram a skontrolujte svoj výsledok!
Krok 8: Nainštalujte svoj model do ThinkBioT
Ak chcete použiť svoj nový lesklý model, jednoducho vložte model a súbor txt do priečinka CModel;
pi> ThinkBioT> ClassProcess> CModel
Teraz ste pripravení používať ThinkBioT:)
** NB ** Ak používate svoj model mimo rámca ThinkBioT, budete musieť upraviť svoj štítkový dokument tak, aby na začiatku každého riadka pridal znamienka, pretože najnovšia vstavaná funkcia "readlabels" tlmočníkov tflite predpokladá, že tam sú. Napísal som vlastnú funkciu do rámca ThinkBioT classify_spect.py ako prácu, okolo ktorej by ste mohli používať svoj vlastný kód:)
def ReadLabelFile (cesta_souboru):
counter = 0 with open (file_path, 'r', encoding = 'utf-8') as f: lines = f.readlines () ret = {} for line in lines: ret [int (counter)] = line.strip () počítadlo = počítadlo + 1 návrat ret