Проблема, описанная в вопросе, возникает, когда для пустого / нового документа задано значение «ANSI», и в него вставляются символы Unicode .
При использовании с пустым / новым документом автоопределение отсутствует, по крайней мере, в той версии Notepad ++, на которой я его тестировал (v5.4.5). «ANSI» является значением по умолчанию в Notepad ++ для нового документа, если оно не задано в меню « Настройки» → « Настройки» → вкладка « Новый документ» / «Открыть каталог» .
Решение
Решение состоит в том, чтобы установить кодировку UTF-8 перед вставкой, меню Формат → Кодировать в UTF-8 :
пример
Я скопировал некоторый текст в новый документ Notepad ++, русский (русский язык, русский язык) , из Firefox, показывающий страницу Википедии на русском языке .
Если кодировка не изменилась с «ANSI», это результат:
Если кодирование будет изменено это результат:
Как видно на рисунке ниже ( выделена кириллическая часть), Notepad ++ фактически преобразует символы Unicode в ASCII 63 (шестнадцатеричный 3F), вопросительные знаки. Вот почему символы Unicode теряются (в режиме «ANSI» ) при копировании текста через буфер обмена (это не проблема шрифта - информация теряется).
Проверено на: Notepad ++ v5.4.5 (UNICODE).