add distinct on file ids
Co-authored-by: EJ Song <51077614+sezruby@users.noreply.github.com>
This commit is contained in:
Родитель
ecc455bd84
Коммит
2923e77408
|
@ -100,6 +100,7 @@ object PEFilterIndexRule
|
|||
.parquet(index.content.files.map(_.toString): _*)
|
||||
.where(condition.sql)
|
||||
.select(IndexConstants.DATA_FILE_NAME_ID)
|
||||
.distinct
|
||||
val fileIds = filteredDf.rdd.map(r => r(0)).collect.toSet
|
||||
|
||||
index.fileIdTracker.getFileToIdMap
|
||||
|
|
Загрузка…
Ссылка в новой задаче