Move missing value validations before unique value validations (#2228)

Signed-off-by: Gaurav Gupta <gaugup@microsoft.com>
This commit is contained in:
Gaurav Gupta 2023-08-11 11:01:56 -07:00 коммит произвёл GitHub
Родитель 1eeb20b669
Коммит cd2502a459
Не найден ключ, соответствующий данной подписи
Идентификатор ключа GPG: 4AEE18F83AFDEB23
2 изменённых файлов: 5 добавлений и 5 удалений

Просмотреть файл

@ -534,6 +534,10 @@ class RAIInsights(RAIBaseInsights):
raise UserConfigValidationException(
f'Target name {target_column} not present in train/test data')
# Check if any of the data is missing in test and train data
self._validate_data_is_not_missing(test, "test")
self._validate_data_is_not_missing(train, "train")
categorical_features = feature_metadata.categorical_features
if (categorical_features is not None and
len(categorical_features) > 0):
@ -597,10 +601,6 @@ class RAIInsights(RAIBaseInsights):
"identified as categorical features: "
f"{non_categorical_or_time_string_columns}")
# Check if any of the data is missing in test and train data
self._validate_data_is_not_missing(test, "test")
self._validate_data_is_not_missing(train, "train")
self._validate_feature_metadata(
feature_metadata, train, task_type, model, target_column)

Просмотреть файл

@ -398,7 +398,7 @@ class TestRAIInsightsValidations:
str(ucve.value)
def test_dirty_train_test_data(self):
X_train = pd.DataFrame(data=[['1', np.nan], ['2', '3']],
X_train = pd.DataFrame(data=[['1', 1], ['2', '3']],
columns=['c1', 'c2'])
y_train = np.array([1, 0])
X_test = pd.DataFrame(data=[['1', '2'], ['2', '3']],