홈

현이의 개발 이야기

람다에서 로컬 변수 사용하기 - local variables referenced from a lambda expression must be final or effectively final

Java 2024. 07. 03. 04:03

자바 코드를 작성하다보면 콜백을 사용해야 할 때가 있다.
콜백은 람다로 작성하는 일이 많은데, 이 때 다음과 같은 에러가 발생하는 경우가 있다.
java: local variables referenced from a lambda expression must be final or effectively final
이번 포스트에서는 이 에러가 나는 이유와 이를 해결할 수 있는 여러 방법들을 소개하고자 한다.

시나리오

에러를 재현하기 위해 다음과 같은 상황을 가정해보자.
  1. 긴 정수 배열에 대해 특정 작업을 반복해야 한다.
  2. 중간 중간 진행 상황을 알고자 한다. 이를 위한 메서드 runTasks()를 다음과 같이 작성했다고 하자.
private static void runTasks(int[] array, Consumer<Integer> onProgressUpdate) {
  int tasksDone = 0;
  for (int element : array) {
    // 오래 걸리는 작업
    task(element);
    
    // 10개 작업이 끝날 때 마다 진행도 업데이트
    if (++tasksDone % 10 == 0) {
      onProgressUpdate.accept(tasksDone);
    }
  }
  
  if (tasksDone % 10 != 0) {
    onProgressUpdate.accept(tasksDone);
  }
}
이 메서드를 호출할 때, 진행 상황을 다음과 같이 트래킹해보자.
public static void trackProgress() {
  int currentProgress = 0;
  runTasks(
      new int[] {},
      (progress) -> {
        System.out.println("진행 상황: " + progress);
        currentProgress = progress;
      });
}
currentProgress = progress; 부분에서 문제의 에러가 발생함을 확인할 수 있다.

에러의 원인

에러 메세지를 보면 람다에서 참조하는 지역 변수는 final이거나 effectively final이어야 한다고 한다.
final 변수는 초기화 이후 값 변경이 불가능한 변수이며,
effectively final 변수는 final 키워드가 명시적으로 붙지는 않았지만 사실상 값이 변경되지 않는 변수를 의미한다.
위 예시에서는 currentProgress 변수가 람다 내부에서 값이 변경되기 때문에 문제가 발생하는 것이다.
왜 이러한 제약이 있는걸까?

람다에서 지역 변수의 변경이 제한되는 이유

람다에서 지역 변수의 값 변경이 제한되는 이유를 이해하기 위해 람다 표현식의 특성과 자바의 변수 스코프 개념을 되짚어보자.
  1. 람다는 자신을 둘러싼 외부 범위의 변수에 접근할 수 있다. (람다 캡처링, lambda capturing)
  2. 람다는 메서드 실행 종료 후에도 비동기적으로 실행될 수 있지만, 지역 변수는 메서드 실행이 종료되면 스택에서 사라진다.
    1. 예를 들어, runTasks()에 전달된 람다를 클래스 멤버 변수로 저장해 놓았다고 생각해보자.
    2. trackProgress() 메서드가 종료되는 시점에 currentProgress 변수는 스택에서 할당 해제된다.
    3. 반면, 전달된 onProgressUpdated 람다 객체는 여전히 살아있다.
이러한 문제를 해결하기 위해 자바는 람다 표현식이 캡처하는 지역 변수를 복사하여 별도의 공간에 저장하고, 람다 표현식은 복사된 값을 사용하도록 한다. 만약 원본 지역 변수의 값이 변경될 수 있다면 복사된 값과의 일관성이 깨져 오류가 발생할 수 있다.
따라서 람다 표현식 내부에서 사용되는 지역 변수는 final 또는 effectively final로 선언하여 값 변경을 방지해야 한다. 이를 통해 람다 표현식이 안전하게 변수에 접근하고 사용할 수 있도록 보장할 수 있다.

해결 방법

위에서 살펴보았듯, 람다에서 지역 변수를 직접 변경하는 것은 어렵다. 이를 해결할 수 있는 방법들에 대해 알아보자.

배열로 감싸기

currentProgress를 배열로 감싸는 것으로 이 문제를 우회할 수 있다. 자바에서 배열은 객체이므로, 람다 표현식 내부에서 배열의 요소 값을 변경하는 것은 허용된다.
private static void trackProgress() {
    int[] currentProgress = {0}; // 배열로 감싸기
    runTasks(
        new int[] {},
        (progress) -> {
            System.out.println("진행 상황: " + progress);
            currentProgress[0] = progress; // 배열 요소 변경
        });
}
위 코드에서 currentProgress는 길이가 1인 정수 배열로 선언되었다. 람다 표현식 내부에서는 currentProgress[0]을 변경하여 진행 상황을 업데이트한다. 이렇게 하면 currentProgress 변수 자체는 변경되지 않고 배열의 요소 값만 변경되므로, effectively final 조건을 만족하게 된다.
이 방법은 가장 간단하게 문제를 해결할 수 있는 방법 중 하나이지만, 코드 가독성이 떨어지고 멀티 스레드 환경에서는 문제가 발생할 수 있다는 점을 유의해야 한다. 단일 스레드 환경에서 간단하게 문제를 해결하고 싶을 때 유용하게 사용할 수 있다.

장점

단점

멤버 필드로 만들기

두 번째 해결 방법은 currentProgress 변수를 클래스의 멤버 필드로 선언하는 것이다. 멤버 필드는 람다 표현식의 외부에 선언되므로, 람다 표현식이 캡처하는 변수에 해당하지 않는다. 따라서 effectively final 조건의 적용 대상이 아니며, 람다 표현식 내부에서 자유롭게 값을 변경할 수 있다.
private static int currentProgress = 0; // 멤버 필드로 선언

private static void trackProgress() {
    runTasks(
        new int[] {},
        (progress) -> {
            System.out.println("진행 상황: " + progress);
            currentProgress = progress; // 멤버 필드 변경
        });
}
멤버 필드를 사용하는 방법은 람다 표현식 내부에서 변수에 직접 접근할 수 있어 코드가 간결해지고 가독성이 높아진다는 장점이 있다. 하지만 멀티 스레드 환경에서는 동기화 문제가 발생할 수 있으므로 주의해야 한다. 또한, 객체 지향 설계 원칙을 고려하여 신중하게 사용해야 한다.

장점

단점

AtomicInteger 사용하기

세 번째 해결 방법은 AtomicInteger 클래스를 사용하여 currentProgress 변수를 선언하는 것이다. AtomicInteger는 멀티 스레드 환경에서 안전하게 정수 값을 변경할 수 있도록 설계된 클래스이다.
private static void trackProgress() {
    AtomicInteger currentProgress = new AtomicInteger(0); // AtomicInteger 사용
    runTasks(
        new int[] {},
        (progress) -> {
            System.out.println("진행 상황: " + progress);
            currentProgress.set(progress); // AtomicInteger 값 변경
        });
}
위 코드에서 currentProgress는 AtomicInteger 객체로 선언되었다. 람다 표현식 내부에서는 currentProgress.set(progress) 메서드를 호출하여 진행 상황을 업데이트한다. AtomicInteger는 내부적으로 동기화 처리를 수행하므로, 멀티 스레드 환경에서도 안전하게 값을 변경할 수 있다.
이 방법은 멀티 스레드 환경에서 안전하게 값을 변경해야 하는 경우 가장 적합한 방법이다. Atomic 클래스의 다양한 기능을 활용하여 효율적인 코드를 작성할 수 있다. 단일 스레드 환경에서는 굳이 AtomicInteger를 사용할 필요는 없지만, 멀티 스레드 환경으로 확장될 가능성이 있다면 미리 AtomicInteger를 사용하는 것을 고려해 볼 수 있다.
또, 지역 변수로 선언할 수 있으므로 캡슐화 원칙도 지킬 수 있다.

장점

단점

마무리

지금까지 자바 람다 표현식에서 발생하는 "local variables referenced from a lambda expression must be final or effectively final" 에러의 원인과 해결 방법 세 가지를 살펴보았다.
람다 표현식은 자바 코드를 간결하고 효율적으로 작성하는 데 유용하지만, 외부 변수를 사용할 때 주의해야 할 점이 있다. 특히 람다 캡처링과 변수 범위를 이해하고, final 또는 effectively final 조건을 준수해야 한다.
이번 포스트에서 소개한 세 가지 해결 방법은 각각 장단점을 가지고 있으므로, 상황에 맞는 방법을 선택하여 적용하면 된다. 특히 멀티 스레드 환경에서는 AtomicInteger와 같은 Atomic 클래스들을 사용하는 것이 가장 안전하고 효율적인 방법이다.
이 글이 람다 표현식을 사용하는 데 어려움을 겪는 개발자들에게 도움이 되었기를 바란다.
댓글 0

로그인이 필요합니다.
로그인