Гималайские пики тестирования дата пайплайнов
Казалось бы, все знают как тестировать что бы то ни было - принципы всегда одни и пирамида всегда одинаковая. Юнит-интеграционные-приемочные, да? А что, если я скажу, что так получается не всегда? Когда мы говорим о работе с большим количеством данных, можно оказаться, что всё не так просто. Независимо от того, на каких языках вы пишете, вы столкнётесь с нехваткой инструментов, например, вполне вероятно что придётся писать код на Python и думать над архитектурой тестовой (!) инфраструктуры. Вот как построить тестирование, мы и разберёмся.