Example of reconition for groups of audio files

CPqD · Oct 8, 2018 · ae59165 · ae59165
1 parent 7305af6
commit ae59165
Showing 1 changed file with 151 additions and 0 deletions.
diff --git a/recognizer-examples/src/main/java/br/com/cpqd/asr/recognizer/example/BatchRecognizer.java b/recognizer-examples/src/main/java/br/com/cpqd/asr/recognizer/example/BatchRecognizer.java
@@ -0,0 +1,151 @@
+/*******************************************************************************
+ * Copyright 2018 CPqD. All Rights Reserved.
+ * 
+ * Licensed under the Apache License, Version 2.0 (the "License"); you may not
+ * use this file except in compliance with the License.  You may obtain a copy
+ * of the License at
+ * 
+ *   http://www.apache.org/licenses/LICENSE-2.0
+ * 
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
+ * WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.  See the
+ * License for the specific language governing permissions and limitations under
+ * the License.
+ ******************************************************************************/
+package br.com.cpqd.asr.recognizer.example;
+
+import java.io.BufferedWriter;
+import java.io.File;
+import java.io.IOException;
+import java.net.URISyntaxException;
+import java.nio.file.Files;
+import java.nio.file.Path;
+import java.nio.file.Paths;
+import java.util.List;
+import java.util.stream.Stream;
+
+import br.com.cpqd.asr.recognizer.AudioSource;
+import br.com.cpqd.asr.recognizer.FileAudioSource;
+import br.com.cpqd.asr.recognizer.LanguageModelList;
+import br.com.cpqd.asr.recognizer.RecognitionException;
+import br.com.cpqd.asr.recognizer.SimpleRecognizerListener;
+import br.com.cpqd.asr.recognizer.SpeechRecognizer;
+import br.com.cpqd.asr.recognizer.model.RecognitionAlternative;
+import br.com.cpqd.asr.recognizer.model.RecognitionConfig;
+import br.com.cpqd.asr.recognizer.model.RecognitionResult;
+
+public class BatchRecognizer {
+
+	private SpeechRecognizer recognizer;
+
+	public BatchRecognizer(String serverUrl, String user, String pwd)
+			throws URISyntaxException, IOException, RecognitionException {
+		RecognitionConfig config = RecognitionConfig.builder().maxSentences(1).continuousMode(true).build();
+		recognizer = SpeechRecognizer.builder().serverURL(serverUrl).userAgent("client=JavaSE;app=RecognizeBatch")
+				.credentials(user, pwd).recogConfig(config)
+				.addListener(new SimpleRecognizerListener() {
+					@Override
+					public void onRecognitionResult(RecognitionResult result) {
+						result.getAlternatives().stream().findFirst().ifPresent(a -> {
+							System.out.printf("  [%.2f - %.2f] %s%n", result.getSegmentStartTime(), result.getSegmentEndTime(), a.getText());
+						});
+					}
+				})
+				.build();
+	}
+
+	/**
+	 * Reconhece um arquivo de áudio e gera um arquivo texto com a transcrição.
+	 * 
+	 * @param audioFile Arquivo de áudio
+	 * @param lmList Lista de modelos da língua
+	 */
+	private void recognizeFile(File audioFile, LanguageModelList lmList) {
+		try (BufferedWriter textFile = Files.newBufferedWriter(Paths.get(audioFile.getAbsolutePath() + ".txt"))) {
+			System.out.println("##### Processing audio: " + audioFile);
+			System.out.println();
+			// pode ser de qualquer fonte (neste caso é um arquivo)
+			AudioSource audio = new FileAudioSource(audioFile);
+			// envia o audio para o servidor
+			recognizer.recognize(audio, lmList);
+			// aguarda o resultado do reconhecimento
+			List<RecognitionResult> resultList = recognizer.waitRecognitionResult();
+			for (RecognitionResult result : resultList) {
+				List<RecognitionAlternative> alts = result.getAlternatives();
+				if (!alts.isEmpty()) {
+					textFile.write(alts.get(0).getText() + " ");
+				}
+			}
+			System.out.println("\n");
+		} catch (Exception e) {
+			System.err.println("ERROR: Failure to process audio: " + audioFile + ": " + e.getMessage());
+			e.printStackTrace();
+		}
+	}
+
+	/**
+	 * Reconhece os áudios contidos em um diretório.
+	 * 
+	 * @param audioPath Caminho para o diretório.
+	 * @param lmURI Modelo da língua a ser usado.
+	 * 
+	 * @throws IOException
+	 * @throws RecognitionException
+	 */
+	public void recognize(String audioPath, String lmURI) throws IOException, RecognitionException {
+
+		// modelo da língua
+		LanguageModelList lmList = LanguageModelList.builder().addFromURI(lmURI).build();
+
+		File audioSource = new File(audioPath);
+		if (audioSource.exists()) {
+			if (audioSource.isDirectory()) {
+				try (Stream<Path> paths = Files.walk(Paths.get(audioPath))) {
+					paths.filter(Files::isRegularFile).filter(path -> path.toString().endsWith(".wav"))
+							.map(Path::toFile).forEach(file -> {
+								recognizeFile(file, lmList);
+							});
+				}
+			} else {
+				recognizeFile(audioSource, lmList);
+			}
+		} else {
+			throw new IOException("Audio path not found: " + audioPath);
+		}
+	}
+
+	public void close() {
+		try {
+			recognizer.close();
+		} catch (IOException e) {
+			System.err.println("ERROR: Failure to close recognizer: " + e.getMessage());
+			e.printStackTrace();
+		}
+	}
+
+	public static void main(String[] args) throws IOException, URISyntaxException, RecognitionException {
+
+		if (!(args.length == 3 || args.length == 5)) {
+			System.out.println("Usage: <ws_url> <lang_uri> <wav_path> [ <user> <password> ]");
+			System.out
+					.println("  eg: wss://path/to/server builtin:slm/general /path/to/dir myusername mypassword");
+			return;
+		}
+
+		String url = args[0];
+		String lmURI = args[1];
+		String audioPath = args[2];
+		String user = null;
+		String pwd = null;
+		if (args.length > 3) {
+			user = args[3];
+			pwd = args[4];
+		}
+
+		BatchRecognizer recognizer = new BatchRecognizer(url, user, pwd);
+		recognizer.recognize(audioPath, lmURI);
+		recognizer.close();
+	}
+
+}