The present application provides a mute detection method, system and device based on image classification technology, and a storage medium. The method comprises: collecting an environment image during a current conversation, and preprocessing the environment image to obtain a preprocessed first image; extracting scene features from the first image, and inputting the extracted scene features into a preset scene recognition model, obtaining the recognition result output by the scene recognition model, and determining a target scene where a user is located according to the recognition result; detecting faces in the environment image, determining a first target face from the detected faces, extracting preset features of the first target face, and determining whether the first target face satisfies fatigue features or not according to the preset feature; if satisfied, obtaining a fatigue feature value of the first target face, and calculating according to the target scene and a parameter calculation method to obtain a target parameter; and adjusting the threshold value of a mute classifier into the target parameter, and performing mute detection on the current conversation by means of the adjusted mute classifier.
La présente invention concerne un procédé, un système et un dispositif de détection de silence basé sur une technologie de classification d'images, ainsi qu'un support de stockage. Le procédé consiste à : collecter une image d'environnement pendant une conversation en cours et prétraiter l'image d'environnement pour obtenir une première image prétraitée; extraire des caractéristiques de scène de la première image et entrer les caractéristiques de scène extraites dans un modèle de reconnaissance de scène prédéfini, obtenir le résultat de reconnaissance produit par le modèle de reconnaissance de scène et déterminer une scène cible où se trouve un utilisateur selon le résultat de reconnaissance; détecter des visages dans l'image d'environnement, déterminer un premier visage cible parmi les visages détectés, extraire des caractéristiques prédéfinies du premier visage cible et déterminer si le premier visage cible satisfait ou non des caractéristiques de fatigue selon la caractéristique prédéfinie; si les caractéristiques sont satisfaites, obtenir une valeur de caractéristique de fatigue du premier visage cible et calculer selon la scène cible et un procédé de calcul de paramètre pour obtenir un paramètre cible; et ajuster la valeur de seuil d'un classificateur de silence dans le paramètre cible et effectuer une détection de silence sur la conversation en cours au moyen du classificateur de silence ajusté.
本申请提供一种基于图像分类技术的静音检测方法、系统、设备及存储介质,方法包括:采集当前通话时的环境图像,对环境图像进行预处理,获得预处理后的第一图像;从第一图像中提取场景特征,将提取的场景特征输入预置的场景识别模型,并获得场景识别模型输出的识别结果,根据识别结果确定用户所处的目标场景;检测环境图像中的人脸,并从检测到的人脸中确定第一目标人脸,提取第一目标人脸的预设特征,根据预设特征判断第一目标人脸是否符合疲劳特征;若符合,则获得第一目标人脸的疲劳特征值,并结合目标场景以及参数计算方法计算获得目标参数,将静音分类器门限值调整成目标参数,通过调整好的静音分类器对当前通话进行静音检测。