#1020 handle null bytes when parsing utf8 (#1021)

* add regression test for conversion of null byte

* handle null bytes like single byte characters
This commit is contained in:
Patrick Schmidt 2019-01-16 21:16:51 +01:00 коммит произвёл Billy O'Neal
Родитель be5d43f274
Коммит c5ebc28232
2 изменённых файлов: 10 добавлений и 2 удалений

Просмотреть файл

@ -341,11 +341,11 @@ inline size_t count_utf8_to_utf16(const std::string& s)
for (size_t index = 0; index < sSize;)
{
if (sData[index] > 0)
if (sData[index] >= 0)
{
// use fast inner loop to skip single byte code points (which are
// expected to be the most frequent)
while ((++index < sSize) && (sData[index] > 0))
while ((++index < sSize) && (sData[index] >= 0))
;
if (index >= sSize) break;

Просмотреть файл

@ -153,6 +153,14 @@ SUITE(strings)
auto result = utility::conversions::utf8_to_utf16(input);
VERIFY_ARE_EQUAL(0x7F, result[0]);
// null byte
input.clear();
input.push_back(0);
input.push_back(0);
result = utility::conversions::utf8_to_utf16(input);
VERIFY_ARE_EQUAL(0, result[0]);
VERIFY_ARE_EQUAL(0, result[1]);
// 2 byte character
input.clear();
// U+80