자바에서 컬렉션 프레임워크란 다수의 데이터를 쉽고 효과적으로 처리할 수 있는 표준화된 방법을 제공하는 클래스와 인터페이스 집합입니다.

즉, 데이터를 저장하는 자료구조과 데이터를 처리하는 알고리즘을 구조화하여 클래스로 구현한 것입니다.

모든 컬렉션 프레임워크는 자바의 인터페이스를 기반으로 구현됩니다.

JCF 이전에는 Arrays, Vector, Hashtable과 같은 클래스들이 존재했지만,

또한, 기본 자료구조(List, Set, Map 등)는 프로젝트마다 반복적으로 직접 구현해야 했고, 이는 버그 발생 가능성과 성능 저하로 이어졌습니다.

이를 개선하기 위해 JCF는

참고: Vector나 Hashtable은 하위 호환성을 위해 여전히 존재하지만, 현재는 ArrayList나 HashMap과 같은 새로운 구현체 사용을 권장합니다.

컬렉션 프레임워크에서는 데이터를 저장하는 자료구조에 따라 다음과 같은 핵심이 되는 주요 인터페이스를 정의하고 있습니다.

위의 그림에서 <E>나 <K,V>라는 것은 컬렉션 프레임워크를 구성하는 모든 클래스가 제네릭으로 표현되어 있음을 알려줍니다.

List 와 Set 인터페이스는 모두 Collection 인터페이스를 상속받지만, 구조상의 차이로 인해 Map 인터페이스는 별도로 정의됩니다.

자바 컬렉션 프레임워크의 주요 인터페이스에 대한 더 자세한 사항은 밑의 링크를 참고하면 됩니다.

JFC 컬렉션은 내부적으로 배열이나 해시 테이블을 사용합니다.

만약 초기 용량을 지정하지 않으면, 데이터가 늘어날 때마다 자동으로 용량을 확장해야합니다.(배열 복사 또는 재해싱)

// ArrayList의 초기 용량 지정
List<String> list = new ArrayList<>(1000);

// HashMap의 초기 용량 지정
Map<String, String> map = new HashMap<>(2000, 0.75f);

ArrayList는 매개변수 없는 생성자 사용 시 초기에 내부 배열 크기는 0이지만, 처음 원소가 추가될 때 기본 용량 10으로 초기화됩니다.
용량 증가 규칙 : (oldCapacity + oldCapacity >>1) → 1.5배 증가
여러번의 리사이징이 일어날 경우, 새로운 배열을 만들고, 기존 데이터를 복사하는 과정이므로, CPU 비용 + 메모리 임시 사용량이 발생합니다.
기본 생성자( new ArrayList<>() )
- 10에서 시작 → 15→22 … 이런식으로 1.5배씩 증가
- 5백만개를 담기 위해, 5백만을 초과하는 시점까지 계속 리사이징 진행
- 마지막 증가 후 용량이 6,153,400까지 늘어날 수 있음.
- 내부 배열 크기 x 4byte(참조) = 약 23.4MB (64bit JVM, 객체 헤더·패딩 고려 시 70MB 추정 가능)
초기 용량 지정 (new ArrayList<>(MAX))
- 5,000,000 크기의 배열 확보 → 리사이징 없음
- 내부 배열 크기 x 4byte = 약 19MB → 불필요한 메모리 낭비와 리사이징 비용 방지

로드 팩터 (load factor)란 특정 크기의 자료구조에 데이터가 얼마나 차면 확장할지를 결정하는 비율입니다.

기본값 : 0.75

계산 방식 : 로드 팩터 = 저장된 엔트리 수 / 버킷 수

예를 들어 버킷이 100개이고, 로드 팩터가 0.75이면 75개가 차면 테이블을 확장한다는 뜻입니다.

임계점이란 해시 테이블이 확장되는 정확한 시점(엔트리 수) 입니다.

계산 방식 : 임계점 = 현재 용량 × 로드 팩터

Java Collection Framework