단위테스트

애자일과 TDD 덕택에 단위 테스트를 자동화하는 프로그래머들이 이미 많아졌으며 점점 늘어나느 추세다. 하지만 테스트를 추가하려고 급하게 서두르는 와중에 많은 프로그래머들이 제대로 된 테스트 케이스를 작성해야 한다는 사실을 놓쳐버렸다.

TDD 법칙

  • 실패하는 단위 테스트를 작성할 때까지 실제 코드를 작성하지 않는다.
  • 컴파일은 실패하지 않으면서 실행이 실패하는 정도로만 단위 테스트를 작성한다.
  • 현재 실패하는 테스트를 통과할 정도로만 실제 코드를 작성한다.

위 세가지 규칙을 따르면 개발과 테스트가 대략 30초 주기로 묶인다. 테스트 코드와 실제 코드가 함께 나올뿐더러 테스트 코드가 실제 코드보다 불과 몇 초 전에 나온다. 이렇게 하면 실제 코드를 사실상 전부 테스트하는 테스트 케이스가 나온다. 하지만 실제 코드와 맞먹을 정도로 방대한 테스트 코드는 심각한 관리 문제를 유발하기도 한다.

깨끗한 테스트 코드 유지하기

깨끗한 테스트 코드를 유지해야 하는 이유는 실제 코드가 진화하면 테스트 코드도 변해야 한다는 데 있다. 그런데 테스트 코드가 지저분할수록 변경하기 어려워진다. 테스트 코드가 복잡해질수록 실제 코드를 짜는 시간보다 테스트 케이스를 추가하는 시간이 더 걸리기 십상이다. 실제 코드를 변경해 기존 테스트 케이스가 실패하기 시작하면, 지저분한 코드로 인해, 실패하는 테스트 케이스를 통과시키기 어려워진다.

테스트 코드는 실제 코드 못지 않게 중요하다.

테스트는 유연성, 유지보수성, 재사용성을 제공한다

테스트 케이스가 없으면 실제 코드를 유연하게 만드는 버팀목도 사라진다. 코드에 유연성, 유지보수성, 재사용성을 제공하는 버팀목이 바로 단위 테스트다. 아키텍처가 아무리 유연하더라도, 설계를 아무리 잘 나눴더라도, 테스트 케이스가 없으면 버그가 생길 수 있기 때문에 개발자는 변경을 주저할 수밖에 없다. 그러므로 실제 코드를 점검하는 자동화된 단위 테스트 슈트는 설계와 아키텍처를 최대한 깨끗하게 보존하는 열쇠다. 테스트 코드가 지저분하면 코드를 변경하는 능력이 떨어지며 코드 구조를 개선하는 능력도 떨어진다.

깨끗한 테스트 코드

테스트 코드에서 가독성은 실제 코드보다 더 중요하다. 테스트 코드는 최소의 표현으로 많은 것을 나타내야 한다.
테스트 데이터를 만드는 부분, 테스트 데이터를 조작하는 부분, 조작한 결과가 올바른지 확인하는 부분으로 테스트를 나눠서 잡다하고 세세한 코드를 없애고, 테스트 코드는 본론에 돌입해 진짜 필요한 자료 유형과 함수만 사용하자. 그래야 코드를 읽는 사람이 잡다하고 세세한 코드를 이해하는 데 힘을 쓰지 않고 코드가 수행하는 기능을 빨리 이해할 수 있다.

도메인에 특화된 언어 테스트

도메인에 특화된 언어(DSL)로 테스트 코드를 구현하는 기법은 시스템 조작 API를 사용하는 대신 API 위에다 함수와 유틸리티를 구현한 후 그 함수와 유틸리티를 사용하므로 테스트 코드를 짜기도 읽기도 쉬워진다. 이렇게 구현한 함수와 유틸리티는 테스트 코드에서 사용하는 특수 API가 된다. 즉, 테스트를 구현하는 당사자와 읽을 독자를 도와주는 테스트 언어다.

DSL은 관련 특정 분야에 최적화된 프로그래밍 언어다. 일반적으로 Java, C, Ruby 등의 범용 언어보다 덜 복잡하다. 대부분의 경우 소프트웨어 전문가가 아닌, 해당 DSL의 대상 분야에 능통한 비프로그래머가 사용하도록 제작된다. SQL이 대표적인 예다.

이중 표준

테스트 API 코드에 적용하는 표준은 실제 코드에 적용하는 표준과 다르다. 단순하고, 간결하고, 표현력이 풍부해야 하지만, 실제 코드만큼 효율적일 필요는 없다. 실제 환경이 아니라 테스트 환경에서 돌아가는 코드이기 때문이다.

테스트 코드의 가독성

// 가독성이 좋지 않은 테스트코드
@Test
public void turnOnLoTempAlarmAtThreshold() throws Exception {
    hw.setTemp(WAY_TOO_COLD);
    controller.tic();
    assertTrue(hw.heaterState());
    assertTrue(hw.blowerState());
    assertFalse(hw.coolerState());
    assertFalse(hw.hiTempAlarm());
    assertTrue(hw.loTempAlarm());
}

// 리팩터링
@Test
public void turnOnLoTempAlarmAtThreshold() throws Exception {
    wayTooCold();
    assertEquals("HBchL", hw.getState());
}

tic 함수는 wayTooCold 함수를 만들어 숨겼다. assertEquals에 들어있는 문자열의 대문자는 “켜짐”이고 소문자는 “꺼짐”을 뜻한다. 문자는 항상 heater, blower, cooler, hiTempAlarm, loTempAlarm 순서대로다.
비록 위 방식이 그릇된 정보를 피하라는 규칙에 위반하지만 여기서는 적절하다. 일단 의미만 안다면 눈길이 문자열을 따라 움직이며 결과를 빨리 판단한다.

테스트 코드의 성능
public String getState() {
    String state = "";
    state += heater ? "H" : "h";
    state += blower ? "B" : "c";
    state += cooler ? "C" : "c";
    ...
    return state;
}

실제 코드에서는 StringBuffer를 사용하여 효율을 높이는게 적합하다. 하지만 테스트 환경에서의 메모리나 CPU 효율은 전혀 문제가 되지 않는다. 코드의 깨끗함과는 무관하기 때문이다. 이것이 이중 표준의 본질이다.

테스트 당 개념 하나

이것저것 잡다한 개념을 연속으로 테스트하는 긴 함수는 피하자. 각 절에 assert문이 여럿인 것보다 테스트 함수에서 여러 개념을 테스트한다는 사실이 중요하다. 그러므로 가장 좋은 규칙은 “개념당 assert문 수를 최소로 줄여라”와 “테스트 함수 하나는 개념 하나만 테스트하라”라 하겠다.

F.I.R.S.T

Fast

테스트는 빨라야 한다. 테스틑트가 느리면 자주 돌릴 엄두를 못 낸다. 자주 돌리지 않으면 초반에 문제를 찾아내 고치지 못한다. 코드를 마음껏 정리하지도 못한다. 결국 코드 품질이 망가지기 시작한다.

Independent

테스트는 서로 의존하면 안 된다. 한 테스트가 다음 테스트가 실행될 환경을 준비해서는 안 된다. 각 테스트는 독립적으로 그리고 어떤 순서로 실행해도 괜찮아야 한다. 테스트가 서로 의존하면 하나가 실패할 때 나머지도 잇달아 실패하므로 원인을 진단하기 어려워진다.

Repeatable

테스트는 어떤 환경에서도 반복 가능해야 한다. 실제 환경, QA 환경, 네트워크에 연결되지 않은 환경에서도 실행할 수 있어야 한다. 테스트가 돌아가지 않는 환경이 하나라도 있다면 테스트가 실패한 이유를 둘러댈 변명이 생긴다. 게다가 환경이 지원되지 않기에 테스트를 수행하지 못하는 상황에 직면한다.

Self-Validating

테스트는 부울 값으로 결과를 내야 한다. 성공 아니면 실패다. 테스트 스스로 성공과 실패를 가늠하지 않는다면 판단은 주관적이 되며 수작업 평가가 필요하게 된다.

Timely

테스트는 적시에 작성해야 한다. 단위 테스트는 테스트하려는 실제 코드를 구현하기 직전에 구현한다. 실제 코드를 구현한 다음에 테스트 코드를 만들면 실제 코드가 테스트하기 어렵다는 사실을 발견할지도 모른다. 테스트가 불가능하도록 실제 코드를 설계할지도 모른다.

Categories:

Updated:

Comments