nlp_transcribe

2020-11-11 21:57:04 -05:00
parent 7fae61614d
commit 920a7633cd
9 changed files with 190 additions and 2 deletions
--- a/process_data.py
+++ b/process_data.py
@@ -20,6 +20,7 @@ logging.basicConfig(level=logging.INFO)
 logger=logging.getLogger()

 OPENFACE_PATH = 'pkg/OpenFace/build/bin/FeatureExtraction'
+DEEP_SPEECH = 'pkg/DeepSpeech'
 DLIB_SHAPE_MODEL = 'pkg/shape_detector/shape_predictor_68_face_landmarks.dat'

 def common_video(video_file, args, r_config):
@@ -36,6 +37,8 @@ def common_video(video_file, args, r_config):

    pf.process_facial(video_file, out_path, args.dbm_group, r_config)
    pf.process_acoustic(video_file, out_path, args.dbm_group, r_config)
+    pf.process_nlp(video_file, out_path, args.dbm_group, r_config, DEEP_SPEECH)
+
    pf.remove_file(video_file)
    pf.process_movement(video_file, out_path, args.dbm_group, r_config, DLIB_SHAPE_MODEL)

@@ -79,6 +82,7 @@ def process_raw_audio_file(args, s_config, r_config):
                
                out_path = os.path.join(args.output_path, 'raw_variables')
                pf.process_acoustic(audio_file[0], out_path, args.dbm_group, r_config)
+                pf.process_nlp(audio_file[0], out_path, args.dbm_group, r_config, DEEP_SPEECH)
                
            else:
                logger.info('Enter correct audio(*.wav) file path.')
@@ -130,6 +134,8 @@ def process_raw_audio_dir(args, s_config, r_config):
                
                out_path = os.path.join(args.output_path, 'raw_variables')
                pf.process_acoustic(audio, out_path, args.dbm_group, r_config)
+                pf.process_nlp(audio, out_path, args.dbm_group, r_config, DEEP_SPEECH)
+                
            except Exception as e:
                logger.error('Failed to process wav file.')