Die Windows Spracherkennung ist mittlerweile so gut, dass sie eine sehr gute Alternative zum klassischen Tippen darstellt. Die neusten Windows Version (Windows 11) hat leistungsfähige Funktionen an Bord, mit denen du deinen Computer per Stimme steuern oder Text diktieren kannst. In diesem Artikel zeigen wir Dir, wie du die Windows-Spracherkennung aktivierst und Windows als Diktiergerät verwendest. Außerdem zeigen wir Dir ein paar Tipps, mit denen Du die Qualität der Spracherkennung noch steigern kannst.

Hat Windows eine Diktierfunktion und wie kann ich Text diktieren?

Windows 11 besitzt eine praktische Diktierfunktion, mit der du Text einfach per Sprache eingeben kannst. Im Folgenden erklären wir dir Schritt für Schritt, wie du diese Diktierfunktion aktivierst und nutzt:

  1. Mikrofon einrichten: Stelle sicher, dass du ein funktionierendes Mikrofon an deinem PC hast. Das kann ein eingebautes Mikro (bei Laptops) oder ein Headset/externes Mikrofon sein. Richte es in Windows ein, falls noch nicht geschehen (unter Einstellungen > System > Sound im Bereich Eingabe kannst du dein Mikrofon auswählen, die Lautstärke einstellen und testen). Ein klar verständliches Mikrofon ist wichtig, damit die Spracherkennung gut funktioniert.
  2. Textfeld auswählen: Öffne nun das Programm oder Dokument, in dem du Text diktieren möchtest (z. B. Word, E-Mail, Texteditor). Klicke mit der Maus in das Textfeld oder Dokument, sodass der Cursor an der Stelle blinkt, an der der diktierte Text eingefügt werden soll.
  3. Diktiermodus starten: Drücke die Windows-Logo-Taste + H auf deiner Tastatur. Dadurch öffnet sich am oberen Bildschirmrand eine kleine Diktier-Werkzeugleiste mit einem Mikrofon-Symbol. Alternativ kannst du im Tablet-Modus auf der Bildschirmtastatur auf das Mikrofon-Symbol (neben der Leertaste) tippen. Beim ersten Start der Diktierfunktion wird Windows eventuell um Erlaubnis fragen, die Online-Spracherkennung zu verwenden – bestätige dies, da die Diktierfunktion eine Internetverbindung benötigt.
Windows Spracherkennung mit Windows Taste + H
  1. Spracheingabe nutzen: Sobald die Diktierleiste erscheint, lauscht Windows auf deine Stimme. Du siehst den Hinweis “Ich höre zu… oder ein Mikrofon-Icon, das anzeigt, dass nun aufgenommen wird. Sprich deutlich in ganzen Sätzen, was du schreiben möchtest. Windows 11 wandelt deine gesprochenen Worte in Echtzeit in Text um und fügt sie an der Cursor-Position ein. Du musst nichts weiter tun, als gleichmäßig und klar zu sprechen. Beobachte, wie dein gesprochenes Wort als getippter Text im Dokument erscheint – quasi wie Magie!
Windows Spracherkennung Word - Ich höre zu...
  1. Satzzeichen und Zeilenumbrüche: Während du diktierst, kannst du Interpunktion und Befehle für neue Zeilen einfach mitsprechen. Zum Beispiel sagst du „Komma“ wenn du ein Komma setzen möchtest, „Punkt“ am Ende eines Satzes oder „Fragezeichen“ für ?. Für einen Zeilenumbruch sag „Neue Zeile“ und für einen neuen Absatz „Neuer Absatz“.

    Sprich diese Begriffe natürlich im Kontext deines Satzes – Windows erkennt sie als Befehl und fügt das entsprechende Zeichen ein, anstatt das Wort auszuschreiben. Falls dir das manuelle Ansagen der Satzzeichen zu umständlich ist, kannst du die automatische Zeichensetzung aktivieren: Klicke dazu in der Diktier-Werkzeugleiste auf das Zahnrad-Symbol (Einstellungen) und schalte die Option „Automatische Interpunktion“ ein. Dann versucht Windows, Punkte und Kommas selbstständig anhand deiner Sprechpausen einzufügen.
  2. Diktat beenden: Wenn du fertig bist oder eine Pause einlegen möchtest, kannst du die Spracherkennung jederzeit stoppen. Klicke dafür einfach wieder auf das Mikrofon-Symbol in der Leiste, oder drücke erneut die Tastenkombination Windowstaste + H. Du kannst auch per Sprache beenden, indem du Diktat stoppen sagst – daraufhin deaktiviert sich die Aufnahme. Die Werkzeugleiste bleibt meist offen, falls du bald weiter diktieren willst. Um das Diktieren wieder aufzunehmen, klicke erneut auf das Mikrofon oder drücke die Windows Taste+H ein weiteres Mal.

Tipps zur Spracheingabe in Textverarbeitungsprogrammen wie Word

Besonders gut funktioniert die Spracherkennung und Diktierfunktion im Microsoft Word. Während des Diktierens kannst du mit Sprachbefehlen auch Texte korrigieren und formatieren. Einige Beispiele: Sage „Lösch das“, um das zuletzt Gesagte bzw. das zuletzt eingegebene Wort zu löschen – das entspricht der Entf-/Zurück-Taste. Mit „Markiere das Wort XYZ“ kannst du ein bestimmtes Wort im Text markieren (sofern es eindeutig erkannt wurde).

Für Groß- und Kleinschreibung gibt es Befehle wie „Schreibe Wort groß“ (um einen Begriff mit Kapitalbuchstaben (Kapitälchen) beginnen zu lassen) oder „alles groß schreiben“ (um die nächsten Wörter durchgehend in Großbuchstaben zu schreiben). Auch Text formatieren ist möglich, vor allem in Textverarbeitungen wie Microsoft Word: Hast du z. B. ein Wort markiert, kannst du mit „Fett“ oder „Fett formatieren“ dieses Wort in Fettdruck setzen (entspricht dem Drücken von Strg+B).

Ähnlich funktioniert „Kursiv“ für Kursivschrift (entspricht Strg+I). Diese Formatierungsbefehle hängen jedoch von der Anwendung ab – nicht jede App unterstützt sie direkt. Im Zweifelsfall kannst du immer auf die Methode zurückgreifen, die nötige Tastenkombination per Sprachbefehl auszuführen, wie oben beschrieben.

Satzzeichen und Sonderzeichen

Wie auch in der Diktierfunktion stehen Befehle für Satzzeichen und Sonderzeichen bereit. Du kannst „Komma“, „Punkt“, „Doppelpunkt“, „Strich“ (Minuszeichen), „Ausrufezeichen“, „Fragezeichen“ usw. sagen, um diese Zeichen einzufügen. Für Anführungszeichen gibt es oft spezielle Bezeichnungen wie „Anführungszeichen öffnen“ und „Anführungszeichen schließen“.

Klammern funktionieren ähnlich: „Klammer auf“, „Klammer zu“ für ( und ). Falls du mal wirklich das Wort „Punkt“ ausgeschrieben haben willst und nicht als Zeichen, kannst du das erreichen, indem du „wörtlich ‚Punkt‘“ sagst – aber das geht schon ins Eingemachte. Im Allgemeinen erkennt Windows aber sehr gut, ob du ein Satzzeichen meinst oder das Wort an sich.

Worauf solltest du beim Diktieren achten?

Erstens benötigt die eingebaute Diktierfunktion von Windows 11 eine Internetverbindung, da deine Spracheingaben online von Microsofts Cloud-Dienst (Azure Speech) verarbeitet werden. Stelle also sicher, dass du online bist, sonst funktioniert das Diktat nicht. Außerdem musst Du prüfen, ob Dein Mikrofon korrekt angeschlossen ist. Manche Browser wie der Microsoft Edge oder Google Chrome Browser brauchen eine explizite Freigabe des Mikrofons.

Zweitens: Solltet Ihr Einstellungsmöglichkeiten zur Spracheingabe unter Windows suchen, so findet Ihr diese unter „Zeit und Sprache“ und „Spracherkennung„.

Windows Spracherkennung Einstellungen

Drittens gilt: deutliches Sprechen ist entscheidend. Sprich in normalem Tempo, aber klar und deutlich in Hochdeutsch. Vermeide Dialekt oder umgangssprachliche Ausdrücke, da diese unter Umständen nicht gut erkannt werden. Falls im Raum Hintergrundgeräusche sind, versuche sie zu reduzieren – z. B. Fenster schließen oder Mikrofon näher an den Mund nehmen – damit die Software dich besser versteht.

Welche Befehle kannst du über die Sprachsteuerung eingeben?

Neben dem reinen Diktieren von Text ermöglicht Windows 11 auch die Sprachsteuerung des Computers. Das bedeutet, du kannst mit vordefinierten Sprachbefehlen Programme öffnen, zwischen Fenstern wechseln, durch Menüs navigieren oder Texte bearbeiten, ohne Maus und Tastatur zu verwenden.

Im Folgenden findest du eine Auswahl typischer Sprachbefehle, die Windows 11 versteht. Allerdings sind ein Teil der Funktionen erst in Windows 11 Beta und Insider Versionen freigeschaltet. Wann die Steuerung der Programme per Sprache endgültig für den Endanwender möglich ist, ist derzeit noch nicht bekannt.

Programme per Sprachsteuerung öffnen

Starte Anwendungen bequem per Stimme. Sage zum Beispiel „Öffne Word“ um Microsoft Word zu starten, oder „Öffne Chrome“ um den Chrome-Browser zu öffnen. Windows erkennt gängige Programmnamen. (Tipp: Falls mehrere Apps ähnlich heißen, kann es sein, dass Windows nachfragt oder das falsche öffnet. Dann einfach den Befehl präziser wiederholen, z. B. „Öffne Google Chrome“.)

Zwischen Anwendungen wechseln

Wenn bereits mehrere Programme geöffnet sind, kannst du per Sprachbefehl hin- und herwechseln. Sage z. B. „Wechsle zu Excel“, um zu einer laufenden Excel-Anwendung zu springen, oder „Wechsle zum Browser“, um das aktuell geöffnete Browserfenster in den Vordergrund zu holen. Das ist so, als würdest du mit [Alt]+[Tab] durchwechseln, aber eben per Stimme.

Fenster per Sprachsteuerung steuern

Du kannst offene Fenster auch verwalten. Befehle wie „Minimiere das Fenster“ oder „Maximiere das Fenster“ verkleinern bzw. vergrößern das aktuell aktive Fenster. Mit „Schließe das Fenster“ oder „Schließe [Anwendungsname]“ kannst du Anwendungen beenden, genauso wie ein Klick auf das X-Symbol. Beispielsweise beendet „Schließe Firefox“ den Firefox-Browser.

Scrollen und navigieren

In Dokumenten, Webseiten oder Dateien kannst du mit Sprache scrollen und navigieren. „Scroll nach unten“ bzw. „Scroll nach oben“ entspricht dem Scrollen mit dem Mausrad oder den Pfeiltasten und bewegt den sichtbaren Bereich entsprechend. Befehle wie „Seite nach unten“ oder „Seite nach oben“ blättern seitenweise. Möchtest du zum Desktop zurückkehren, sage „Gehe zum Desktop“ – Windows minimiert dann alle Fenster, als hättest du [Windows]+[D] gedrückt. Selbst das Startmenü lässt sich öffnen: „Öffne Startmenü“ zeigt das Startmenü an, worin du dann mit „Klicke [Name]“ sogar Einträge per Sprache auswählen könntest.

Tastaturbefehle per Stimme

Die Sprachsteuerung erlaubt es dir auch, Tastenanschläge zu simulieren. Du kannst zum Beispiel „Drücke Eingabe“ oder „Drücke Enter“ sagen, um die Eingabetaste auszulösen (z. B. um einen Befehl zu bestätigen). Ebenso funktioniert „Drücke Tab“ zum Wechseln ins nächste Feld. Für komplexe Shortcuts sagst du einfach die Tasten in Reihe: z. B. „Drücke Strg S“ um eine Datei zu speichern (das entspricht [Ctrl]+[S]), oder „Drücke Alt F4“ um ein Fenster zu schließen. Windows erkennt viele solcher Tastenkombinationen per Sprache – das ist hilfreich, wenn ein direktes Sprachkommando für eine Funktion nicht existiert.

Welche Spracherkennungssoftware ist die beste?

Wenn es um Spracherkennung geht, stellt sich oft die Frage: Welche Software ist die beste? Die Antwort hängt von deinen Bedürfnissen ab. Windows 11 hat bereits mehrere eigene Spracherkennungslösungen integriert, die für die meisten Anwender mehr als ausreichend sind. Diese haben den Vorteil, dass sie kostenlos und ohne zusätzliche Installation verfügbar sind. Microsoft hat die Spracherkennung in Windows über die Jahre stark verbessert, sodass du schon mit Bordmitteln sehr gute Ergebnisse erzielen kannst.

Windows-eigene Spracherkennungslösungen umfassen insbesondere die Windows-Spracherkennung (zur Steuerung des PCs per Sprache und zum Diktieren von Text) sowie die Diktierfunktion (auch als Spracheingabe bezeichnet), mit der du direkt in Textfelder sprechen kannst. In Windows 11 wurde zudem ein neues Feature namens “Voice Access” (Sprachzugriff) eingeführt, das in den Einstellungen unter Barrierefreiheit zu finden ist. Dieses ermöglicht es, den PC vollständig per Sprachbefehl zu bedienen und funktioniert sogar offline. Für dich als Einsteiger ist es jedoch am besten, zunächst die standardmäßige Windows-Spracherkennung und Diktierfunktion auszuprobieren, bevor du dich mit erweiterten Funktionen beschäftigst.

Externe Spracherkennungssoftware wie Dragon NaturallySpeaking (ein bekanntes kommerzielles Programm) wird oft von Profis wegen ihrer hohen Erkennungsgenauigkeit genutzt. Solche Programme bieten zusätzliche Funktionen und Anpassungsmöglichkeiten, kosten aber meist Geld und müssen extra installiert werden. Für den Anfang brauchst du sie in der Regel nicht – die integrierte Spracherkennung von Windows 11 ist ein guter Startpunkt. Erwähne externe Lösungen höchstens am Rande, damit du weißt, dass es sie gibt; den Großteil deiner Anforderungen kann Windows aber bereits von Haus aus erfüllen.

Fazit

Windows 11 verfügt über eine sehr gute Spracherkennungsfunktionen, die sich auch ideal für Anfänger eignen. Du kannst sofort loslegen, ohne extra Software kaufen zu müssen. Einfach ein Mikrofon anschließen und die Diktierfunktion mit der Tastenkombination Windows Taste + H aktivieren.

Wie bereits geschrieben, arbeitet Microsoft an weiteren Funktionen, um die reine Windows Diktierfunktion um Funktionen zur Steuerung des gesamten PCs zu ermöglichen. Sobald Microsoft diese Funktionen in Ihre offiziellen Feature Updates integriert hat, werden wir erneut darüber berichten.