Java 中的音节计数器
Hiten Kanwar
2023年10月12日
音节是任何具有元音的单词发音的基本单位。本教程中音节的规范是每个相邻的元音算作一个音节。
例如,在单词 real
中,ea
构成一个音节。但是对于 regal
这个词,会有两个音节:e
和 a
。但是,单词末尾的 e
不会算作一个音节。此外,无论前面提到的规则如何,每个单词都至少有一个音节。
本教程将讨论如何使用 Java 创建具有上述规范的音节计数器。
在 Java 中使用用户定义的函数创建音节计数器
我们可以创建自己的方法 SyllableCount()
,根据提供的规范对音节进行计数。首先,我们使用 toLowerCase()
函数并将所需的字符串转换为小写。我们遍历字符串并单独检查每个字符,是否是元音,以及前一个字符。
我们在下面的代码中实现了这一点。
import java.util.*;
public class Main {
static public int SyllableCount(String s) {
int count = 0;
s = s.toLowerCase();
for (int i = 0; i < s.length(); i++) { // traversing till length of string
if (s.charAt(i) == '\"' || s.charAt(i) == '\'' || s.charAt(i) == '-' || s.charAt(i) == ','
|| s.charAt(i) == ')' || s.charAt(i) == '(') {
// if at any point, we encounter any such expression, we substring the string from start
// till that point and further.
s = s.substring(0, i) + s.substring(i + 1, s.length());
}
}
boolean isPrevVowel = false;
for (int j = 0; j < s.length(); j++) {
if (s.contains("a") || s.contains("e") || s.contains("i") || s.contains("o")
|| s.contains("u")) {
// checking if character is a vowel and if the last letter of the word is 'e' or not
if (isVowel(s.charAt(j)) && !((s.charAt(j) == 'e') && (j == s.length() - 1))) {
if (isPrevVowel == false) {
count++;
isPrevVowel = true;
}
} else {
isPrevVowel = false;
}
} else {
count++;
break;
}
}
return count;
}
static public boolean isVowel(char c) {
if (c == 'a' || c == 'e' || c == 'i' || c == 'o' || c == 'u') {
return true;
} else {
return false;
}
}
public static void main(String[] args) {
String ans = "Regal";
String ans1 = "Real";
System.out.println("syllables for string " + ans + " is " + SyllableCount(ans));
System.out.println("syllables for string " + ans1 + " is " + SyllableCount(ans1));
}
}
输出:
syllables for string Regal is 2
syllables for string Real is 1
在上面的方法中,我们将问题拆分,阅读这些行,将它们拆分为单词,然后计算每个单词的音节。之后,我们为每一行计数。
在 Java 中使用正则表达式创建音节计数器
我们也可以使用正则表达式。我们可以使用 Matcher.find()
函数使用给定字符串的模式查找音节。
请记住导入 java.util.regex
包以使用正则表达式。
请参考下面的代码。
import java.util.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Main {
static public int countSyllables(String s) {
int counter = 0;
s = s.toLowerCase(); // converting all string to lowercase
if (s.contains("the ")) {
counter++;
}
String[] split = s.split("e!$|e[?]$|e,|e |e[),]|e$");
ArrayList<String> al = new ArrayList<String>();
Pattern tokSplitter = Pattern.compile("[aeiouy]+");
for (int i = 0; i < split.length; i++) {
String s1 = split[i];
Matcher m = tokSplitter.matcher(s1);
while (m.find()) {
al.add(m.group());
}
}
counter += al.size();
return counter;
}
public static void main(String[] args) {
String ans = "Regal";
System.out.println("syllables for string " + ans + " is " + countSyllables(ans));
}
}
输出:
syllables for string Regal is 2