StarWhisper

StarWhisper — Descargar gratis. Transcripción de voz offline

StarWhisper es una solución de conversión de voz a texto que opera sin conexión a internet. La aplicación procesa el audio directamente en el dispositivo Windows del usuario, empleando aceleración por GPU para transcripciones en tiempo real. Todos los datos de audio y texto permanecen en el ordenador local, sin transmitirse a servidores externos. El software está construido sobre el motor Whisper.cpp optimizado, proporcionando reconocimiento de voz preciso con soporte para múltiples idiomas y modelos de distintos tamaños.

5.0(1 valoraciones)

Descargar StarWhisper (Enlaces oficiales)
Tamaño del archivo: 2.4 MB
La última versión de StarWhisper es: 1.3.105
Sistema operativo: Windows
Idiomas: English
Precio: $0.00 USD
Producto propietario y freemium. Suscripción que cuesta 10 $ al mes + versión gratuita con funcionalidad limitada.

  • Transcripción en tiempo real. La función convierte el habla en texto de forma inmediata mientras el usuario habla. El motor procesa el flujo de audio con una latencia mínima, mostrando el texto en la interfaz principal. Esta característica está diseñada para dictado continuo en procesadores de texto, clientes de correo electrónico o cualquier campo de entrada de texto dentro del sistema Windows.
  • Funcionamiento completamente offline. Todo el procesamiento de reconocimiento de voz se ejecuta localmente en la máquina del usuario. No se requiere conexión a internet para la funcionalidad principal. Los modelos de lenguaje se almacenan en el disco duro y se cargan en la memoria del sistema o VRAM durante el uso.
  • Aceleración por GPU. La aplicación descarga la mayor parte de la carga computacional a la unidad de procesamiento gráfico cuando está disponible. Esta implementación reduce significativamente el uso de la CPU y permite un rendimiento en tiempo real, incluso con los modelos de reconocimiento más grandes y precisos.
  • Modelos de lenguaje configurables. El usuario puede seleccionar entre diferentes modelos Whisper, desde 'tiny' hasta 'large'. Los modelos más pequeños ofrecen velocidad de transcripción mayor, mientras que los modelos grandes proporcionan una exactitud superior, especialmente para audio complejo o con acentos específicos.
  • Modo de dictado por pulsación. Una modalidad donde la transcripción solo se activa mientras el usuario mantiene pulsada una tecla configurable. Este método es adecuado para insertar frases cortas o comandos sin necesidad de activar/desactivar el dictado continuo manualmente.
  • Ventana flotante minimalista. La interfaz de usuario consiste en una ventana transparente que permanece siempre visible sobre otras aplicaciones. Muestra el estado de la transcripción, el texto convertido reciente y controles básicos sin distracciones visuales.
  • Atajos de teclado personalizables. Los usuarios pueden definir combinaciones de teclas para iniciar y detener la grabación, activar el modo de pulsación, pausar el reconocimiento o mostrar/ocultar la ventana de la aplicación. Los atajos funcionan a nivel global del sistema.
  • Formateo y puntuación automática. El motor no solo transcribe palabras, sino que también inserta signos de puntuación como puntos, comas, signos de interrogación y mayúsculas al inicio de las oraciones. Este procesamiento posterior mejora la legibilidad del texto generado.
  • Transcripción de archivos de audio. Capacidad para cargar archivos de audio preexistentes en formatos comunes (WAV, MP3, FLAC) y generar una transcripción de texto completa. La función procesa el archivo por completo y guarda el resultado en un documento de texto editable.
  • Selección de idioma manual y automática. El usuario puede fijar el idioma de entrada para mejorar la precisión, o dejar que el modelo lo detecte automáticamente. La detección automática de idioma analiza los primeros segundos de audio para determinar la configuración lingüística más probable.
  • Modo de compatibilidad para CPU. Un mecanismo de respaldo que se activa automáticamente en sistemas sin GPU dedicada o con controladores problemáticos. En este modo, todos los cálculos de la red neuronal se ejecutan en el procesador central, manteniendo la funcionalidad offline completa.
  • Indicadores de estado visuales. La interfaz presenta iconos y cambios de color que informan al usuario sobre el estado actual: en espera, grabando, procesando o en pausa. Estos indicadores proporcionan retroalimentación inmediata sobre la actividad del sistema.
  • Historial de transcripciones. Un registro que guarda automáticamente las sesiones de dictado recientes. Los usuarios pueden revisar, copiar o exportar textos transcritos anteriormente desde una sección dedicada de la aplicación.
  • Reducción de ruido básica. Un preprocesamiento del audio de entrada que aplica filtros para minimizar el ruido ambiental constante antes de que la señal llegue al modelo de reconocimiento. Este procesamiento mejora los resultados en entornos no ideales.

El desarrollo de StarWhisper comenzó en 2023 como una implementación nativa para Windows del proyecto de código abierto Whisper.cpp, que a su vez es una portabilidad en C++ del modelo Whisper de OpenAI. Los desarrolladores son un equipo independiente enfocado en crear herramientas de productividad con privacidad integrada. La aplicación está escrita principalmente en C++ para el núcleo de procesamiento y utiliza el framework Qt para la interfaz gráfica de usuario. La elección de C++ garantiza un rendimiento cercano al metal y un consumo eficiente de recursos, mientras que Qt proporciona una base multiplataforma para un potencial futuro desarrollo en otros sistemas operativos.


Alternativas a StarWhisper:

Glimp — Descargar gratis. Asistente IA para entrevistas laborales

Glimp

Glimp es un copiloto de entrevistas impulsado por inteligencia artificial que ofrece asistencia en tiempo real durante entrevistas virtuales.
Precio: Gratis   Tamaño: 25 MB   Versión: 0.1.7   SO: Windows
Speakey — Descargar gratis. Dictado por voz local y privado

Speakey

Speakey es una aplicación de dictado en tiempo real que procesa voz directamente en el ordenador del usuario, sin depender de servicios en la nube.
Precio: $45   Tamaño: 356 MB   Versión: 1.3.0   SO: Windows
RocketWhisper — Descargar gratis. Transcripción offline con IA y GPU

RocketWhisper

RocketWhisper es una aplicación de escritorio para reconocimiento de voz y transcripción basada en el motor OpenAI Whisper.
Precio: $32   Tamaño: 110 MB   Versión: 1.2.0   SO: Windows, Linux, MacOS
VoiceOS — Descargar gratis. Voz a texto instantáneo en todas las aplicaciones

VoiceOS

VoiceOS es una interfaz de voz universal que transcribe el habla natural a texto escrito y pulido de forma instantánea en cualquier aplicación.
Precio: Gratis   Tamaño: 117 MB   Versión: 1.0   SO: Windows
Typeless — Descargar gratis. Dictado por voz con IA

Typeless

En el competitivo mundo del dictado por voz, Typeless se posiciona como una herramienta de inteligencia artificial que transcribe y, además, edita y pule el texto en tiempo real.
Precio: Gratis   Tamaño: 129 MB   Versión: 0.9.6   SO: Windows, Mac OS, Android, iOS
BB Recorder — Descargar gratis. Grabación local y transcripción privada

BB Recorder

BB Recorder es una aplicación de grabación de reuniones y llamadas que opera completamente en el dispositivo del usuario.
Precio: Gratis   Tamaño: 22 MB   Versión: 1.0.0   SO: MacOS, iOS
Vowen — Descargar gratis. Software de transcripción y control por voz

Vowen

Software de productividad que convierte el habla en texto y comandos ejecutados localmente en macOS y Windows.
Precio: Gratis   Tamaño: 156 MB   Versión: 0.1.12   SO: Windows, MacOS
VoiceInk — Descargar gratis. Transcripción de voz local para macOS

VoiceInk

VoiceInk es una aplicación de dictado y transcripción de voz que utiliza modelos de IA local para convertir voz a texto con precisión, funcionando completamente offline y respetando la privacidad de los usuarios.
Precio: Gratis   Tamaño: 12.61 MB   Versión: 1.70   SO: MacOS
OpenWispr — Descargar gratis. Transcripción de voz local y en la nube

OpenWispr

Este programa es una aplicación de escritorio de dictado de código abierto que convierte el habla en texto.
Precio: Gratis   Tamaño: 115 MB   Versión: 1.0.14   SO: Windows, Linux, MacOS
Pipit — Descargar gratis. Transcripción de voz local para macOS

Pipit

La aplicación Pipit convierte voz en texto en tiempo real utilizando modelos de IA que funcionan completamente en el dispositivo.
Precio: Gratis   Tamaño: 8.2 MB   Versión: 1.05   SO: MacOS
Whispering Tiger — Descargar gratis. Transcripción, Traducción y Síntesis de voz

Whispering Tiger

Whispering Tiger es una aplicación integral para conversión de voz a texto, procesamiento de texto, extracción de texto de imágenes y otras tareas.
Precio: Gratis   Tamaño: 13.2 MB   Versión: 1.3.9.8   SO: Windows