¿Hay alguna manera de tomar una grabación de voz y generar un video de una persona animada hablando las palabras?

6 sitios gratuitos para crear tus propias animaciones
Voki – Inicio

Inicio – XtraNormal

FaceRig en Steam

Había un programa de ‘Modelado 3D’ llamado TrueSpace – Wikipedia – Microsoft lo compró y lo cerró en 2009 – ¡tenía características de ‘cabeza parlante’!
Probablemente exista algo similar en Maya o Blender,
Enorme curva de aprendizaje para el bricolaje, ¡pero el mundo está lleno de expertos por un precio!

Pero el reconocimiento de voz es dudoso.

Respuesta del usuario de Quora a ¿Cuál es la forma más rápida de encontrar ciertas palabras habladas en la grabación de audio o video?

Después de leer la otra respuesta, creo que es mejor evitar el texto, simplemente imitar el movimiento de los labios.
Si su punto de partida es audio, tal vez hablar junto con él generaría un video.
¿Preguntar si usar marcadores de maquillaje ayudaría?
Captura de movimiento facial – Wikipedia

Sincronización automática de labios