Commit 3a6a98d57480677ff3c216c8a29a28366631bf02
1 parent
7e0691c7
文字替换符号处理。
Showing
1 changed file
with
4 additions
and
3 deletions
src/main/java/com/xly/util/AdvancedSymbolRemover.java
| ... | ... | @@ -38,10 +38,11 @@ public class AdvancedSymbolRemover { |
| 38 | 38 | text = text.replaceAll("(?<!\\d)-(?![\\d.])|(?<=\\d)-", ""); |
| 39 | 39 | |
| 40 | 40 | // ============================ |
| 41 | - // 🔥 核心:只保留 中文、英文、数字、小数点、负号、空格 | |
| 42 | - // 其他所有符号全部清空! | |
| 41 | + // 🔥 修正版:保留 中文、英文、数字、小数点、负号、空格 | |
| 42 | + // 🔥 额外保留:中文标点 。,、;:?! | |
| 43 | + // 只删除 * # @ % ^ & 等特殊符号 | |
| 43 | 44 | // ============================ |
| 44 | - text = text.replaceAll("[^a-zA-Z0-9\\u4e00-\\u9fa5\\-. ]", ""); | |
| 45 | + text = text.replaceAll("[^a-zA-Z0-9\\u4e00-\\u9fa5\\-. 。,、;:?!]", ""); | |
| 45 | 46 | |
| 46 | 47 | // 多余空格变成单个空格(更干净) |
| 47 | 48 | text = text.replaceAll("\\s+", " ").trim(); | ... | ... |