3
Эквиваленты Unicode для \ w и \ b в регулярных выражениях Java?
Многие современные реализации регулярных выражений интерпретируют \wсокращение класса символов как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение , как \w+спички слова , как hello, élève, GOÄ_432или gefräßig. К сожалению, в Java нет. В Java \wограничено [A-Za-z0-9_]. Это, среди прочего, затрудняет сопоставление слов, подобных упомянутым выше. …