Restructure unit tests

2021-01-25 18:21:51 -05:00 · 2021-01-25 18:21:51 -05:00 · 3b293bd856
--- a/tests/e2e/test_anchor_e2e.py
+++ b/tests/e2e/test_anchor_e2e.py
@ -10,8 +10,8 @@ from genalog.text import alignment, anchor, preprocess
@pytest.mark.parametrize(
    "gt_file, ocr_file",
    zip(
-        sorted(glob.glob("tests/text/data/gt_*.txt")),
-        sorted(glob.glob("tests/text/data/ocr_*.txt")),
+        sorted(glob.glob("tests/unit/text/data/gt_*.txt")),
+        sorted(glob.glob("tests/unit/text/data/ocr_*.txt")),
    ),
 )
 def test_align_w_anchor_and_align(gt_file, ocr_file):
@ -37,8 +37,8 @@ def test_align_w_anchor_and_align(gt_file, ocr_file):
@pytest.mark.parametrize(
    "gt_file, ocr_file",
    zip(
-        sorted(glob.glob("tests/text/data/gt_*.txt")),
-        sorted(glob.glob("tests/text/data/ocr_*.txt")),
+        sorted(glob.glob("tests/unit/text/data/gt_*.txt")),
+        sorted(glob.glob("tests/unit/text/data/ocr_*.txt")),
    ),
 )
@pytest.mark.parametrize("max_seg_length", [25, 50, 75, 100, 150])
--- a/tests/e2e/test_document_generation.py
+++ b/tests/e2e/test_document_generation.py
@ -11,7 +11,7 @@ CONTENT = CompositeContent(
 UNSUPPORTED_CONTENT_FORMAT = ["foo bar"]
 UNSUPPORTED_CONTENT_TYPE = CompositeContent(["foo"], [ContentType.TITLE])

-CUSTOM_TEMPLATE_PATH = "tests/generation/templates"
+CUSTOM_TEMPLATE_PATH = "tests/unit/generation/templates"
 CUSTOM_TEMPLATE_NAME = "mock.html.jinja"
 CUSTOM_STYLE_TEMPLATE_NAME = "font_family.html.jinja"
 MULTI_PAGE_TEMPLATE_NAME = "multipage.html.jinja"
--- a/tests/e2e/test_pipeline.py
+++ b/tests/e2e/test_pipeline.py
@ -4,7 +4,7 @@ import pytest

 from genalog import pipeline

-EXAMPLE_TEXT_FILE = "tests/text/data/gt_1.txt"
+EXAMPLE_TEXT_FILE = "tests/unit/text/data/gt_1.txt"


@pytest.fixture
@ -36,7 +36,7 @@ def test_custom_generate_img(custom_analog_generator):


 def test_generate_dataset_multiprocess():
-    INPUT_TEXT_FILENAMES = glob.glob("tests/text/data/gt_*.txt")
+    INPUT_TEXT_FILENAMES = glob.glob("tests/unit/text/data/gt_*.txt")
    with pytest.deprecated_call():
        pipeline.generate_dataset_multiprocess(
            INPUT_TEXT_FILENAMES, "test_out", {}, [], "text_block.html.jinja"
--- a/tests/ocr/.env
+++ b/tests/ocr/.env
@ -1,8 +0,0 @@
-COMPUTER_VISION_ENDPOINT = "https://enki-vision.cognitiveservices.azure.com/"
-SEARCH_SERVICE_NAME = "ocr-ner-pipeline"
-SKILLSET_NAME = "testocrskillset"
-INDEX_NAME = "testocrindex"
-INDEXER_NAME = "testocrindexer"
-DATASOURCE_NAME = "syntheticimages"
-DATASOURCE_CONTAINER_NAME = "testocrimages"
-BLOB_NAME = "syntheticimages"
--- a/tests/cases/init.py
+++ b/tests/cases/init.py
--- a/tests/unit/cases/init.py
+++ b/tests/unit/cases/init.py
--- a/tests/unit/cases/label_propagation.py
+++ b/tests/unit/cases/label_propagation.py
--- a/tests/unit/cases/text_alignment.py
+++ b/tests/unit/cases/text_alignment.py
--- a/tests/unit/degradation/test_degrader.py
+++ b/tests/unit/degradation/test_degrader.py
--- a/tests/unit/degradation/test_effect.py
+++ b/tests/unit/degradation/test_effect.py
--- a/tests/unit/generation/2x2.jpg
+++ b/tests/unit/generation/2x2.jpg
--- a/tests/unit/generation/templates/font_family.html.jinja
+++ b/tests/unit/generation/templates/font_family.html.jinja
--- a/tests/unit/generation/templates/mock.html.jinja
+++ b/tests/unit/generation/templates/mock.html.jinja
--- a/tests/unit/generation/templates/multipage.html.jinja
+++ b/tests/unit/generation/templates/multipage.html.jinja
--- a/tests/unit/generation/test_content.py
+++ b/tests/unit/generation/test_content.py
--- a/tests/unit/generation/test_document.py
+++ b/tests/unit/generation/test_document.py
@ -12,12 +12,12 @@ MOCK_COMPILED_DOCUMENT = "<p>populated document</p>"
 MOCK_TEMPLATE = MagicMock()
 MOCK_TEMPLATE.render.return_value = MOCK_COMPILED_DOCUMENT

-IMG_BYTES = open("tests/generation/2x2.jpg", "rb").read()
+IMG_BYTES = open("tests/unit/generation/2x2.jpg", "rb").read()

 FILE_DESTINATION_PDF = "sample.pdf"
 FILE_DESTINATION_PNG = "sample.png"

-CUSTOM_TEMPLATE_PATH = "tests/generation/templates"
+CUSTOM_TEMPLATE_PATH = "tests/unit/generation/templates"
 CUSTOM_TEMPLATE_NAME = "mock.html.jinja"
 DEFAULT_TEMPLATE_NAME = "text_block.html.jinja"
 DEFAULT_PACKAGE_NAME = "genalog.generation"
--- a/tests/unit/ocr/data/img/0.png
+++ b/tests/unit/ocr/data/img/0.png
--- a/tests/unit/ocr/data/img/1.png
+++ b/tests/unit/ocr/data/img/1.png
--- a/tests/unit/ocr/data/img/11.png
+++ b/tests/unit/ocr/data/img/11.png
--- a/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_0.json
+++ b/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_0.json
--- a/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_1.json
+++ b/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_1.json
--- a/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_11.json
+++ b/tests/unit/ocr/data/json/521c38122f783673598856cd81d91c21_11.json
--- a/tests/unit/ocr/data/metrics.csv
+++ b/tests/unit/ocr/data/metrics.csv
--- a/tests/unit/ocr/data/metrics/json/123_001.json
+++ b/tests/unit/ocr/data/metrics/json/123_001.json
--- a/tests/unit/ocr/data/metrics/json/123_002.json
+++ b/tests/unit/ocr/data/metrics/json/123_002.json
--- a/tests/unit/ocr/data/metrics/json/123_003.json
+++ b/tests/unit/ocr/data/metrics/json/123_003.json
--- a/tests/unit/ocr/data/metrics/metrics.csv
+++ b/tests/unit/ocr/data/metrics/metrics.csv
--- a/tests/unit/ocr/data/metrics/substitution.pkl
+++ b/tests/unit/ocr/data/metrics/substitution.pkl
--- a/tests/unit/ocr/data/metrics/text/001.txt
+++ b/tests/unit/ocr/data/metrics/text/001.txt
--- a/tests/unit/ocr/data/metrics/text/002.txt
+++ b/tests/unit/ocr/data/metrics/text/002.txt
--- a/tests/unit/ocr/data/metrics/text/003.txt
+++ b/tests/unit/ocr/data/metrics/text/003.txt
--- a/tests/unit/ocr/data/substitution.json
+++ b/tests/unit/ocr/data/substitution.json
--- a/tests/unit/ocr/data/substitution.pkl
+++ b/tests/unit/ocr/data/substitution.pkl
--- a/tests/unit/ocr/data/text/0.txt
+++ b/tests/unit/ocr/data/text/0.txt
--- a/tests/unit/ocr/data/text/1.txt
+++ b/tests/unit/ocr/data/text/1.txt
--- a/tests/unit/ocr/data/text/11.txt
+++ b/tests/unit/ocr/data/text/11.txt
--- a/tests/unit/ocr/test_metrics.py
+++ b/tests/unit/ocr/test_metrics.py
--- a/tests/unit/ocr/test_ocr.py
+++ b/tests/unit/ocr/test_ocr.py
--- a/tests/unit/text/data/gt_1.txt
+++ b/tests/unit/text/data/gt_1.txt
--- a/tests/unit/text/data/gt_2.txt
+++ b/tests/unit/text/data/gt_2.txt
--- a/tests/unit/text/data/gt_3.txt
+++ b/tests/unit/text/data/gt_3.txt
--- a/tests/unit/text/data/label_generator/labels/0.tsv
+++ b/tests/unit/text/data/label_generator/labels/0.tsv
--- a/tests/unit/text/data/label_generator/labels/1.tsv
+++ b/tests/unit/text/data/label_generator/labels/1.tsv
--- a/tests/unit/text/data/label_generator/labels/11.tsv
+++ b/tests/unit/text/data/label_generator/labels/11.tsv
--- a/tests/unit/text/data/label_generator/text/0.txt
+++ b/tests/unit/text/data/label_generator/text/0.txt
--- a/tests/unit/text/data/label_generator/text/1.txt
+++ b/tests/unit/text/data/label_generator/text/1.txt
--- a/tests/unit/text/data/label_generator/text/11.txt
+++ b/tests/unit/text/data/label_generator/text/11.txt
--- a/tests/unit/text/data/ocr_1.txt
+++ b/tests/unit/text/data/ocr_1.txt
--- a/tests/unit/text/data/ocr_2.txt
+++ b/tests/unit/text/data/ocr_2.txt
--- a/tests/unit/text/data/ocr_3.txt
+++ b/tests/unit/text/data/ocr_3.txt
--- a/tests/unit/text/test_alignment.py
+++ b/tests/unit/text/test_alignment.py
@ -5,8 +5,8 @@ from unittest.mock import MagicMock
 import pytest

 from genalog.text import alignment
-from tests.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES
-from tests.cases.text_alignment import PARSE_ALIGNMENT_REGRESSION_TEST_CASES
+from tests.unit.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES
+from tests.unit.cases.text_alignment import PARSE_ALIGNMENT_REGRESSION_TEST_CASES

 RANDOM_INT = randint(1, 100)
 MOCK_ALIGNMENT_RESULT = [("X", "X", 0, 0, 1)]
--- a/tests/unit/text/test_anchor.py
+++ b/tests/unit/text/test_anchor.py
@ -4,7 +4,7 @@ import warnings
 import pytest

 from genalog.text import alignment, anchor, preprocess
-from tests.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES
+from tests.unit.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES


@pytest.mark.parametrize(
@ -200,8 +200,8 @@ def test_find_anchor_recur_fixed_seg_len(
@pytest.mark.parametrize(
    "gt_file, ocr_file",
    zip(
-        sorted(glob.glob("tests/text/data/gt_1.txt")),
-        sorted(glob.glob("tests/text/data/ocr_1.txt")),
+        sorted(glob.glob("tests/unit/text/data/gt_1.txt")),
+        sorted(glob.glob("tests/unit/text/data/ocr_1.txt")),
    ),
 )
@pytest.mark.parametrize("max_seg_length", [75])
--- a/tests/unit/text/test_conll_format.py
+++ b/tests/unit/text/test_conll_format.py
--- a/tests/unit/text/test_lcs.py
+++ b/tests/unit/text/test_lcs.py
--- a/tests/unit/text/test_ner_label.py
+++ b/tests/unit/text/test_ner_label.py
@ -1,7 +1,7 @@
 import pytest

 from genalog.text import ner_label
-from tests.cases.label_propagation import LABEL_PROPAGATION_REGRESSION_TEST_CASES
+from tests.unit.cases.label_propagation import LABEL_PROPAGATION_REGRESSION_TEST_CASES


@pytest.mark.parametrize(
--- a/tests/unit/text/test_preprocess.py
+++ b/tests/unit/text/test_preprocess.py
--- a/tests/unit/text/test_utf8.py
+++ b/tests/unit/text/test_utf8.py
@ -5,7 +5,7 @@ import pytest

 from genalog.text import alignment
 from genalog.text.alignment import GAP_CHAR
-from tests.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES
+from tests.unit.cases.text_alignment import ALIGNMENT_REGRESSION_TEST_CASES


 def random_utf8_char(byte_len=1):