Merge branch 'microsoft:main' into feature/cvt-model-opset

This commit is contained in:
Kaz Nishimura 2024-03-27 22:28:40 +09:00 коммит произвёл GitHub
Родитель 2b38779815 31f129c779
Коммит 3e6e60649b
Не найден ключ, соответствующий данной подписи
Идентификатор ключа GPG: B5690EEEBB952194
2 изменённых файлов: 5 добавлений и 2 удалений

Просмотреть файл

@ -39,6 +39,8 @@ extends:
cloudvault:
enabled: false
globalSdl:
asyncSdl:
enabled: false
tsa:
enabled: true
binskim:

Просмотреть файл

@ -43,10 +43,11 @@ class HFTokenizerConverter(CustomOpConverter):
f"{hf_tokenizer.__name__}: vocab_files_names is not found")
tokenizer_file = filenames["tokenizer_file"]
if (hf_tokenizer.vocab_file is None) or (not os.path.exists(hf_tokenizer.vocab_file)):
vocab_file = getattr(hf_tokenizer, "vocab_file", None)
if (vocab_file is None) or (not os.path.exists(vocab_file)):
model_dir = hf_tokenizer.name_or_path
else:
model_dir = os.path.dirname(hf_tokenizer.vocab_file)
model_dir = os.path.dirname(vocab_file)
tokenizer_json = json.load(
open(os.path.join(model_dir, tokenizer_file), "r", encoding="utf-8"))
# get vocab object from json file