{"id":340,"date":"2025-11-09T09:00:00","date_gmt":"2025-11-09T09:00:00","guid":{"rendered":"https:\/\/www.tb-software.ch\/ai\/sprachgesteuerte-aufzeichnung-fuer-iot\/"},"modified":"2025-11-09T09:00:00","modified_gmt":"2025-11-09T09:00:00","slug":"sprachgesteuerte-aufzeichnung-fuer-iot","status":"publish","type":"post","link":"https:\/\/www.tb-software.ch\/ai\/sprachgesteuerte-aufzeichnung-fuer-iot\/","title":{"rendered":"Sprachgesteuerte Aufzeichnung f\u00fcr IoT"},"content":{"rendered":"<p>Wer ein kleines Ger\u00e4t per Sprache steuern will, braucht vor allem eines: stabile Erkennung ohne Daueraufzeichnung und ohne Fehlstarts. In diesem Beitrag zeige ich eine praxistaugliche L\u00f6sung, die lokal l\u00e4uft, mit einem dynamischen Schwellenwert arbeitet und Sequenzen automatisch startet und wieder stoppt. Der Fokus liegt auf Funktion und Alltagstauglichkeit, nicht auf Internet.<\/p>\n<p><img decoding=\"async\" src=\"https:\/\/www.tb-software.ch\/ai\/wp-content\/uploads\/2026\/05\/grafik-1024x502-1.png\" alt=\"\" loading=\"lazy\"><\/p>\n<p>Bemerkenswert: die Transkription hat vor dem Treshold die m\u00f6glichkeit sauber einzusteigen und auch anschliessend sauber zu beenden. Wir haben hier nicht die ersten Silben verschluckt, sondern ganze Worte, was die Qualit\u00e4t perfektioniert.<\/p>\n<h2>Ziel<\/h2>\n<p>Kurze Sprachaufgaben zuverl\u00e4ssig erfassen und als Text ablegen. Alles offline m\u00f6glich. Ideal f\u00fcr Edge Ger\u00e4te, Werkstatt PC, Mini Server oder einen stillen B\u00fcrorechner. Die L\u00f6sung passt zum TB-Software Stil der kompakten Projektposts und How-tos. <a href=\"https:\/\/tb-software.ch\/page\/posts\/\">TB-Software<\/a><\/p>\n<h2>So funktioniert es im Betrieb<\/h2>\n<ol>\n<li>Start \u00fcber <code>start_voice_recorder.bat<\/code>.<\/li>\n<li>Erst einige Sekunden ruhig bleiben. Das System kalibriert das Grundrauschen im Raum.<\/li>\n<li>Sprich normal. Die Aufnahme startet erst, wenn deine Stimme klar \u00fcber dem gemessenen Basispegel liegt.<\/li>\n<li>Kurze Laute wie ein einzelnes \u201eh\u00e4\u201c werden ignoriert. Ein vollst\u00e4ndiger Satz wie \u201eHallo wie geht es dir heute\u201c wird erfasst.<\/li>\n<li>Nach etwa f\u00fcnf Sekunden Stille stoppt die Aufnahme automatisch.<\/li>\n<li>Ergebnis findest du im Ordner <code>log<\/code>: Audio als MP3 und Transkript als TXT sowie JSON.<\/li>\n<\/ol>\n<h2>Warum dieser Ablauf robust ist<\/h2>\n<ul>\n<li><strong>Dynamischer Schwellenwert<\/strong> passt sich dem Raum an. Leiser Keller, lautes B\u00fcro, wechselnde L\u00fcfter.<\/li>\n<li><strong>Voraufzeichnung<\/strong> puffert die letzten zwei Sekunden. Nichts vom Satzanfang geht verloren.<\/li>\n<li><strong>Ruhefenster<\/strong> verhindert Zwischen-Auswertungen w\u00e4hrend Denkpausen.<\/li>\n<li><strong>Segmentgrenze<\/strong> nach Stille. Jedes Kommando wird sauber abgeschlossen und kann erst dann verarbeitet werden.<\/li>\n<\/ul>\n<h2>Typische Eins\u00e4tze<\/h2>\n<ul>\n<li>Notizzettel am Werkplatz.<\/li>\n<li>Kurze Kommandos f\u00fcr ein Heimautomations-Gateway.<\/li>\n<li>Bedienung im Labor, wenn die H\u00e4nde voll sind.<\/li>\n<li>Protokolle w\u00e4hrend Tests, ohne Cloud Zwang.<\/li>\n<\/ul>\n<h2>Qualit\u00e4t in der Praxis<\/h2>\n<p>Die Erkennung l\u00e4uft lokal und braucht kein Internet. Online Modelle verstehen oft noch etwas mehr, aber f\u00fcr klare S\u00e4tze in normalem Abstand reicht die Qualit\u00e4t in vielen Umgebungen gut aus. Entscheidend ist das Mikrofon und die N\u00e4he zur Stimme. Je n\u00e4her, desto weniger Raumanteil, desto sauberer das Transkript.<\/p>\n<h2>Tipps f\u00fcr stabile Ergebnisse<\/h2>\n<ul>\n<li>Mikrofon 10 bis 20 cm vor den Mund.<\/li>\n<li>Leise Tastaturen und L\u00fcfter helfen.<\/li>\n<li>Kurze, eindeutige S\u00e4tze sprechen.<\/li>\n<li>Bei sehr halligen R\u00e4umen ein Headset nutzen.<\/li>\n<\/ul>\n<h2>Dateien und Logs<\/h2>\n<ul>\n<li><code>log\/audio\/\u2026mp3<\/code> enth\u00e4lt die Aufnahme.<\/li>\n<li><code>log\/transcriptions\/\u2026txt<\/code> ist der reine Text.<\/li>\n<li><code>log\/transcriptions\/\u2026json<\/code> f\u00fchrt Details wie Zeitstempel.<\/li>\n<\/ul>\n<h2>Grenzen<\/h2>\n<ul>\n<li>Sehr leise Sprecher oder starke St\u00f6rger\u00e4usche senken die Trefferquote.<\/li>\n<li>Extrem kurze Einwortlaute werden absichtlich nicht erfasst, damit das System ruhig bleibt.<\/li>\n<\/ul>\n<p><img decoding=\"async\" src=\"https:\/\/www.tb-software.ch\/ai\/wp-content\/uploads\/2026\/05\/grafik-1-2.png\" alt=\"\" loading=\"lazy\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wer ein kleines Ger\u00e4t per Sprache steuern will, braucht vor allem eines: stabile Erkennung ohne Daueraufzeichnung und ohne Fehlstarts. In diesem Beitrag zeige ich eine praxistaugliche L\u00f6sung, die lokal l\u00e4uft, mit einem dynamischen Schwellenwert arbeitet und Sequenzen automatisch startet und wieder stoppt. Der Fokus liegt auf Funktion und Alltagstauglichkeit, nicht auf Internet. Bemerkenswert: die Transkription\u2026<\/p>\n","protected":false},"author":1,"featured_media":337,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[37],"tags":[],"class_list":["post-340","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-applikationsentwicklung"],"_links":{"self":[{"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/posts\/340","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=340"}],"version-history":[{"count":0,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/posts\/340\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=\/wp\/v2\/media\/337"}],"wp:attachment":[{"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=340"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=340"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.tb-software.ch\/ai\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=340"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}