A liveness detection method and apparatus, a device, and a storage medium. The method comprises: obtaining multimedia data to be detected; extracting audio data and video data of the multimedia data; performing speech recognition on the audio data to obtain speech information, and performing lip language recognition on the video data to obtain lip language information; and parsing according to the speech information and the lip language information to obtain offset information between the audio data and the video data, and verifying, on the basis of the offset information, whether the multimedia data is from a living body. The accuracy of liveness detection is significantly improved, an omission rate of liveness detection is reduced, and an error-tolerant rate is provided for some videos of which the audio and picture are out of sync. Thus, the original annotation cost of a large number of videos of which the audio and picture are out of sync is saved.
L'invention concerne un procédé et un appareil de détection d'état vivant, un dispositif et un support de stockage. Le procédé comprend les étapes suivantes : obtenir des données multimédias devant subir une détection ; extraire des données audio et des données vidéo des données multimédias ; effectuer une reconnaissance de la parole sur les données audio pour obtenir des informations de parole, et effectuer une reconnaissance de langage de lèvres sur les données vidéo pour obtenir des informations de langage de lèvres ; et effectuer l'analyse syntaxique selon les informations de parole et les informations de langage de lèvres pour obtenir des informations de décalage entre les données audio et les données vidéo, et vérifier, en fonction des informations de décalage, si les données multimédias proviennent d'un corps vivant. La précision de la détection de l'état vivant est considérablement améliorée, un taux d'omission de détection d'état vivant est réduit, et un taux tolérant les erreurs est fourni pour certaines vidéos dont l'audio et l'image sont désynchronisés. Ainsi, le coût d'annotation d'origine d'un grand nombre de vidéos dont l'audio et l'image sont désynchronisés est économisé.
一种活体检测方法、装置、设备和存储介质,包括:获取待检测的多媒体数据;提取多媒体数据中的音频数据和视频数据;对音频数据进行语音识别,得到语音信息,以及对视频数据进行唇语识别,得到唇语信息;根据语音信息和唇语信息解析得到音频数据和视频数据之间的偏移信息,并基于偏移信息验证多媒体数据是否来自于活体。显著提高了活体检测的准确率,降低了活体检测的漏检率,对于一些音画不同步的视频提供了容错率。节省了原来对大量音画不同步视频的标注成本。