Fedi Post mit Open Source Spracherkennungs-Editoren
Mehr oder weniger zufällig habe ich heute die Möglichkeit von STT "Speech To Text" Modulen auf meinem Smartphone entdeckt. Also Apps die helfen Gesprochenes in Schrift und Text umzuwandeln - man nennt so was wohl auch "Eingabemethodeneditor (IME) mit Spracherkennung".
Für allmögliche schnelle Notizen ist so was wohl recht nützlich aber man kann es freilich auch für das Erstellen von Fedi Posts nutzen.
Die zwei Open Source Spracherkennungs-Editoren die ich getestet habe waren:
sayboard
und
whisper
Sayboard transkribiert fast simultan - Whisper macht erste eine Tonaufnahme und erstellt dann verzögert die Transcription. Bauchbar sind beide Resultate wobei Whisper mit Groß- und Kleinschreibung und mit Satz- und Punktsetzung viel besser klar kommt. Ich habe Sayboard wieder deinstalliert und Whisper weiter getestet.
Nach der Installation muss man die App noch als Bildschirmtastatur hinzufügen.
Der Spracheingabeeditor öffnet sich dann immer wenn Texteingaben möglich sind automatisch oder wahlweise erst mit einem Klick auf das kleine Mikrophon Symbol am virtuellen Keyboard.
Mit drücken des großen Microphonsymbols im Spracheingabeeditor beginnt die Aufnahme. Wenn man fertig mit seiner Spracheingabe ist lässt man die Taste einfach wieder los - maximal Länge beträgt 30 Sekunden. Mehrere Aufnahmen hintereinander sind möglich. Nach der Spracheingabe erscheint der Text nach wenigen Sekunden im Texteingabefeld - so auch in meinem Hubzilla Channel.
Whisper für Android wurde von OpenAI - Whisper
portiert und bietet noch die Option den Text direkt ins Englische zu übersetzen. Resultat ist mal gut mal weniger gut...Mal sehen wie und wo ich nun von diesen neu entdecken Möglichkeit Gebrauch machen werde.
Erstmal bin ich beeindruckt und begeistert.
teilten dies erneut
*_jayrope
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Carsten
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •zeitverschreib [friendica]
Als Antwort auf Carsten • •@Carsten
Sobald iOS auf dem Level von GrapheneOS angekommen ist, schaue ich mir vielleicht auch noch mal ein Apfelphone an. 😉
@𝓒𝓱𝓻𝓲𝓼
Carsten
Als Antwort auf zeitverschreib [friendica] • • •zeitverschreib [friendica]
Als Antwort auf Carsten • •@Carsten Zum Beispiel die Kontrolle über das, was die verschiedenen Apps dürfen und was nicht.
Alternative App-Stores wie fdroid.
Thunderbird.
Openkeychain
Zugriff auf das komplette Dateisystem über USB.
Geräte unter EUR 500 Neupreis.
Vernünftige Nutzbarkeit ohne iCloud.
𝓒𝓱𝓻𝓲𝓼
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Es gibt einfach Situationen, in denen man schneller was in ein Mikrofon spricht, als anfängt einen Text zu tippen.
Vor allem am Smartphone. wo das Tippen doch auch immer ein wenig mühsam ist.
Und ja, die ganze Sache funktioniert lokal und offline, sobald die Modude installiert sind.
Wusste nicht, dass das bei iOS auch so ist. Apple lauscht doch ständig mit, bei dem was auf dem Gerät passiert.
Thomas
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Also ich nutze die Spracheingabe von #Futo und bin ganz zufrieden.
𝓒𝓱𝓻𝓲𝓼
Als Antwort auf Thomas • • •@Thomas
habe es gerade gewagt mal voiceinput Futo anzutesten
https://voiceinput.futo.org/
FUTO Voice, The Voice Input app that respects your privacy
funktioniert scheinbar auch sehr gut. Das Module ist auch um einiges schlanker als das von Whisper... dafür gibt es keine Übersetzungsfunktion nach Englisch.
Irritieren bei voiceinput Futo ist, dass da mit einem F-droid download geworben wird aber die Datei gar nicht im Repo von F-droid zu finden ist. Man muss erst das extra Futo Repo hinzufügen... Ein Überprüfung des Codes von Seiten von F-droid hat also nicht stattgefunden und ich finde auch keinen anderen Link für ein Repo wo der Quellcode einsehbar ist... das obwohl Futo mit Open Source wirbt
What is FUTO?: https://futo.org/about/what-is-futo/
What is FUTO?
What is FUTO?𝓒𝓱𝓻𝓲𝓼
Als Antwort auf Thomas • • •Ok hier ist der Link zum Quellcode
GitLab: https://gitlab.futo.org/keyboard/voiceinput
FUTO Voice Input application for Android
Und hier die License unter der alles läuft:
GitLab: https://gitlab.futo.org/keyboard/voiceinput/-/blob/master/LICENSE.md?ref_type=heads
FUTO Voice Input application for Android
Hmm ???
keyboard / VoiceInput · GitLab
GitLabThomas
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Es wird eine FUTO Source First License 1.0 verwendet. Sie erlaubt öffentlichen Zugriff auf den Quellcode, Nutzung, Änderung und Weitergabe für alle, schränkt aber die kommerzielle Nutzung durch große Unternehmen ein, um Entwickler zu schützen. Details unter FUTO Open Source
𝓒𝓱𝓻𝓲𝓼
Als Antwort auf Thomas • • •@Thomas die Lizenz ist voll ok für nicht kommerzielle Nutzung - also für unsereins.. ja
@Winterstar
meine Fragezeichen entstanden in der Kombi weil eben mit F-droid gewoben wir aber dort von FUTO nicht zu finde ist. Was mögen die Gründe dafür sein?
Winterstar
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Ich verstehe, warum das verwirrend ist.
F-Droid ist zunächst einmal eine Technik, um Software zu verteilen. Diese liegt in sogenannten Repositories, kurz Repos.
Jeder kann so ein Repo bereitstellen, z.B Futo: app.futo.org/fdroid/repo/
Um es zu nutzen, musst du es in der F-Droid-App hinzufügen.
F-Droid selbst betreibt allerdings ein eigenes Repo, das standardmäßig in der App drin ist. Dort sind nur von F-Droid geprüfte Apps zu finden.
FUTO F-Droid Repo
FUTO F-Droid RepoWinterstar
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Alexander Goeres ?
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •Markus
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •@𝓒𝓱𝓻𝓲𝓼 füge das Repo bei F-Droid ein:
FUTO F-Droid Repo: https://app.futo.org/fdroid/repo/
Software created by FUTO
FUTO F-Droid Repo
FUTO F-Droid Repo𝓒𝓱𝓻𝓲𝓼
Als Antwort auf Markus • • •Markus
Als Antwort auf 𝓒𝓱𝓻𝓲𝓼 • • •