Heuristic Search(문제 해결을 위한 효율적인 탐색 기법)

학교 공부/인공지능

Heuristic Search(문제 해결을 위한 효율적인 탐색 기법)

wqdsdsf 2024. 11. 11. 22:10

*1976년 앨런 뉴웰(Allen Newell)과 허버트 사이먼(Herbert A. Simon)이 튜링상 수상 강연에서 했던 내용
문제 해결 과정: 기호 시스템은 문제와 문제 공간이 주어졌을 때, 제한된 처리 자원을 사용하여 가능한 해결책을 하나씩 생성해 나갑니다. 이 과정은 해결책이 문제를 정의하는 테스트를 만족시킬 때까지 계속됩니다.

생성 순서의 중요성(100% x): 만약 기호 시스템이 잠재적인 해결책을 생성하는 순서를 통제할 수 있다면, 실제 해결책이 더 빨리 나타날 가능성이 높은 순서로 배열하는 것이 바람직합니다.

지능의 정의: 기호 시스템이 이 과정을 성공적으로 수행할 수 있다면, 그 시스템은 지능을 발휘한다고 할 수 있습니다. 즉, 제한된 처리 자원을 가진 시스템에서 지능은 다음에 무엇을 해야 할지 현명한 선택을 하는 능력에 달려 있습니다.

정의와 목적:휴리스틱은 최적의 해결책을 보장하지는 않지만, 즉각적인 목표 달성에 충분한 실용적인 문제 해결 접근 방식입니다. 이는 의사 결정의 인지적 부담을 줄이고 더 빠른 문제 해결을 가능하게 합니다.

다양한 분야에서의 응용휴리스틱은 여러 분야에서 활용됩니다:

인지심리학: 불확실성 하에서의 의사 결정에 사용되는 정신적 지름길로 연구됩니다.
인공지능: AI와 컴퓨터 과학에서 최적의 해결책을 더 효율적으로 찾기 위해 사용됩니다.
경제학: 행동경제학에서는 경제적 행동에서의 비합리적 의사 결정을 설명하는 데 휴리스틱을 활용합니다.

상태 공간 탐색에서의 정의상태 공간 탐색에서 휴리스틱은 수용 가능한 문제 해결책으로 이어질 가능성이 가장 높은 상태 공간의 가지를 선택하는 규칙으로 공식화됩니다. 이는 현재 상태가 목표 상태에 얼마나 "가까운지"를 추정하여 탐색 과정을 더 효율적으로 안내합니다.

탐색 전략의 유형

비정보 탐색: 너비 우선 탐색(BFS)이나 깊이 우선 탐색(DFS)과 같은 방법은 휴리스틱을 사용하지 않고 상태 공간을 탐색합니다.
정보 탐색: A* 알고리즘과 같은 방법은 휴리스틱을 사용하여 어떤 상태가 더 유망한지 평가하고, 탐색해야 할 노드의 수를 크게 줄입니다.

장점과 과제

효율성: 휴리스틱은 유망한 경로에 집중함으로써 탐색 알고리즘의 효율성을 크게 향상시킬 수 있습니다.
최적성: 휴리스틱이 탐색 과정을 가속화할 수 있지만, 항상 최적의 해결책으로 이어지지는 않을 수 있습니다.
계산 복잡성: 휴리스틱은 복잡한 문제 영역에서 흔히 발생하는 상태 공간 폭발 문제를 완화하는 데 도움을 줍니다.

휴리스틱은 완벽함을 추구하기보다는 실용성과 효율성에 중점을 둔 문제 해결 방법으로, 다음과 같은 특징을 가집니다:

1. 실용성 중심 - 휴리스틱은 '완벽한' 해결책보다는 '충분히 좋은' 해결책을 찾는 데 중점을 둡니다. 이는 현실 세계의 많은 문제들이 시간이나 자원의 제약 때문에 최적의 해결책을 찾기 어렵다는 점을 고려한 접근 방식입니다

.2. 신속한 의사 결정 - 휴리스틱은 복잡한 상황에서 빠르게 판단하고 결정을 내릴 수 있게 해줍니다. 이는 특히 시간이 중요한 상황에서 유용합니다.

3. 인지적 부담 감소 - 휴리스틱은 문제 해결 과정에서 고려해야 할 요소들을 줄여줍니다. 이를 통해 의사 결정자는 모든 가능한 선택지를 철저히 분석하는 대신, 중요한 몇 가지 요소에 집중할 수 있습니다.

4. 효율성 증대 - 완벽한 해결책을 찾는 데 많은 시간과 자원을 투자하는 대신, 휴리스틱은 합리적인 시간 내에 수용 가능한 해결책을 제공합니다. 이는 전체적인 문제 해결 과정의 효율성을 높입니다.

5. 유연성 - 휴리스틱은 다양한 상황에 적용할 수 있는 유연한 접근 방식입니다. 정확한 알고리즘이 없거나 적용하기 어려운 상황에서도 사용할 수 있습니다.

6. 경험과 직관의 활용 - 휴리스틱은 종종 경험이나 직관에 기반합니다. 이는 전문가의 지식이나 과거의 경험을 문제 해결에 효과적으로 활용할 수 있게 해줍니다.

휴리스틱의 한계와 특성

휴리스틱은 문제 해결을 위한 유용한 도구이지만, 완벽한 방법은 아닙니다. 다음은 휴리스틱의 주요 한계와 특성입니다:

1. 오류 가능성 - 휴리스틱은 모든 발견과 발명의 규칙과 마찬가지로 오류를 범할 수 있습니다. 이는 휴리스틱이 완벽한 해결책을 보장하지 않음을 의미합니다

2. 추측에 기반한 접근 - 휴리스틱은 문제 해결 과정에서 다음 단계에 대한 '정보에 기반한 추측'에 불과합니다. 이는 휴리스틱이 항상 최적의 경로를 제시하지는 않을 수 있음을 의미합니다.

3. 예측의 한계 - 휴리스틱은 탐색 과정에서 더 먼 단계의 상태 공간의 정확한 동작을 예측하는 데 한계가 있습니다. 이는 복잡한 문제에서 장기적인 결과를 정확히 예측하기 어려울 수 있음을 의미합니다.

4. 제한된 정보 사용 - 휴리스틱은 제한된 정보만을 사용하기 때문에 위와 같은 한계를 가집니다. 모든 가능한 정보를 고려하지 않고 일부 정보만을 선택적으로 사용하여 판단을 내립니다.

휴리스틱의 의의

이러한 한계에도 불구하고 휴리스틱은 여전히 중요한 문제 해결 도구입니다:

효율성: 복잡한 문제에 대해 빠르게 대응할 수 있게 해줍니다.
실용성: 완벽한 해결책을 찾는 것이 불가능하거나 비실용적인 상황에서 유용합니다.
적응성: 새로운 상황에 빠르게 적응할 수 있게 해줍니다.
인지 부하 감소( 불확실성 처리 ): 의사 결정 과정에서 고려해야 할 요소를 줄여줍니다.
계산 복잡성 감소: 모든 가능성을 탐색하는 대신, 유망한 해결책에 집중함으로써 계산 복잡성을 줄일 수 있습니다
인간의 문제 해결 방식 모방: 휴리스틱은 인간 전문가의 사고 과정을 모방하여, 보다 자연스럽고 이해하기 쉬운 AI 시스템을 만들 수 있습니다.

*Dynamic Programming

Best-First Search와 Hill Climbing은 휴리스틱 탐색 알고리즘의 대표적인 예시

Best-First Search 구현

Best-First Search는 휴리스틱 정보를 활용하여 더 효율적인 탐색을 수행하는 알고리즘입니다. 주요 특징은 다음과 같습니다:

오픈 리스트(Open List) 사용
- 현재 탐색의 경계(fringe)를 추적하는 데 사용됩니다.
- 아직 탐색하지 않은 노드들을 저장합니다.
- 우선순위 큐로 구현되어 가장 유망한 노드를 빠르게 선택할 수 있습니다.
클로즈드 리스트(Closed List) 사용
- 이미 방문한 상태(노드)를 기록합니다.
- 중복 탐색을 방지하고 순환을 피하는 데 도움이 됩니

Best-First Search는 다음과 같이 구현할 수 있습니다:

우선순위 큐 사용: 탐색할 노드들을 휴리스틱 값에 따라 정렬된 우선순위 큐에 저장합니다.
노드 확장: 우선순위 큐에서 가장 유망한(휴리스틱 값이 가장 좋은) 노드를 선택하여 확장합니다.
자식 노드 평가: 확장된 노드의 모든 자식 노드를 생성하고 각각의 휴리스틱 값을 계산합니다.
큐 업데이트: 생성된 자식 노드들을 우선순위 큐에 추가합니다.
반복: 목표 상태에 도달하거나 더 이상 탐색할 노드가 없을 때까지 2-4 단계를 반복합니다.

Hill Climbing 구현

Hill Climbing은 Best-First Search의 간소화된 버전으로, 다음과 같이 구현할 수 있습니다:

현재 노드 확장: 현재 노드의 자식 노드들을 생성합니다.
최선의 자식 선택: 자식 노드들 중 가장 좋은 휴리스틱 값을 가진 노드를 선택합니다.
이동: 선택된 자식 노드로 이동합니다. 이때 다른 자식 노드들과 부모 노드는 버립니다.
반복: 더 이상 개선이 없을 때까지 1-3 단계를 반복합니다.

Hill-Climbing의 주요 문제점

잘못된 휴리스틱으로 인한 무한 경로
- 부적절한 휴리스틱 함수는 알고리즘을 목표와 무관한 방향으로 계속 이동하게 할 수 있습니다.
- 이는 해결책을 찾지 못하고 무한히 탐색을 계속하는 결과를 초래할 수 있습니다.
이력 관리 부재
- Hill-Climbing은 현재 상태만을 고려하고 이전 상태의 정보를 저장하지 않습니다.
- 이로 인해 잘못된 경로에 빠졌을 때 이전 상태로 돌아가 다른 경로를 탐색하는 것이 불가능합니다.
지역 최적해(Local Maxima) 문제
- 알고리즘이 전역 최적해(Global Optimum)가 아닌 지역 최적해에 도달하면 더 이상 개선할 수 없어 멈추게 됩니다.
- 이는 더 나은 해결책이 존재함에도 불구하고 탐색을 중단하는 결과를 낳습니다.

성능 개선 방법

교란(Perturbation)
- 현재 상태에 작은 무작위 변화를 주어 지역 최적해에서 벗어나려는 시도입니다.
- 이는 Simulated Annealing과 같은 더 복잡한 알고리즘의 기본 아이디어가 됩니다.
Random Restart
- 여러 번의 무작위 초기점에서 Hill-Climbing을 실행하는 방법입니다.
- 이는 다양한 지역 최적해를 탐색할 수 있게 해주지만, 여전히 전역 최적해를 보장하지는 않습니다.
Beam Search
- 여러 개의 상태를 동시에 탐색하여 지역 최적해에 빠질 가능성을 줄입니다.

주요 특징

단순성: Hill Climbing은 Best-First Search보다 구현이 더 간단합니다. 메모리 사용량도 적습니다.
지역 최적해: Hill Climbing은 지역 최적해에 빠질 수 있습니다. 반면 Best-First Search는 더 넓은 탐색을 수행합니다.
메모리 사용: Best-First Search는 탐색 과정에서 많은 노드를 메모리에 저장해야 할 수 있습니다. Hill Climbing은 현재 노드만 기억하면 됩니다.
완전성: Best-First Search는 적절한 구현 시 완전한 알고리즘이 될 수 있습니다. Hill Climbing은 완전성을 보장하지 않습니다.
휴리스틱 의존성: 두 알고리즘 모두 휴리스틱 함수의 품질에 크게 의존합니다. 좋은 휴리스틱은 탐색 효율을 크게 향상시킬 수 있습니다.

좋은 휴리스틱을 설계하는 것은 어려운 경험적 문제입니다. 주요 포인트는 다음과 같습니다:

휴리스틱 설계의 어려움
- 위의 예시들은 좋은 휴리스틱을 고안하는 것이 쉽지 않음을 보여줍니다.
- 단일 상태 정보만으로 지능적인 선택을 하는 것이 목표이지만, 이는 도전적인 작업입니다.
휴리스틱 설계의 목표
- 제한된 정보(단일 상태 정보)를 사용하여 지능적인 선택을 하는 것입니다.
- 완전한 정보가 없는 상황에서 최선의 추정을 해야 합니다.
좋은 휴리스틱의 특성
- 계산이 빠르고 효율적이어야 합니다.
- 목표 상태까지의 실제 비용을 잘 추정해야 합니다.
- 문제의 특성을 잘 반영해야 합니다.
경험적 접근 방식
- 휴리스틱 설계는 주로 경험적 문제입니다.
- 직관과 판단이 도움이 되지만, 충분하지 않습니다.
성능 평가의 중요성
- 휴리스틱의 최종 평가 기준은 실제 문제 인스턴스에서의 성능입니다.
- 이론적으로 좋아 보이는 휴리스틱도 실제 성능이 좋지 않을 수 있습니다.
반복적 개선
- 초기 휴리스틱을 설계한 후 실제 성능을 분석하고 개선하는 과정이 필요합니다.
- 다양한 문제 인스턴스에 대해 테스트하고 결과를 분석해야 합니다.
도메인 지식의 활용
- 문제 도메인에 대한 깊은 이해가 좋은 휴리스틱 설계에 도움이 됩니다.
- 도메인 전문가의 인사이트를 활용하는 것이 유용할 수 있습니다.

휴리스틱 탐색과 전문가 시스템의 관계에 대해 정리해 드리겠습니다:

전문가 시스템에서의 휴리스틱 구현
- 신뢰도 측정(confidence measures)을 사용하여 규칙의 결과를 평가합니다
- 성공 가능성이 가장 높은 결론을 선택하기 위해 신뢰도를 활용합니다.
- 매우 낮은 신뢰도를 가진 상태는 완전히 제거될 수 있습니다.
간단한 게임(예: 8-퍼즐)을 사용하는 이유
- 탐색 공간이 휴리스틱 가지치기가 필요할 만큼 충분히 크습니다.
- 대부분의 게임은 다양한 휴리스틱 평가를 비교하고 분석할 수 있을 만큼 복잡합니다.
- 게임은 일반적으로 복잡한 표현 문제를 포함하지 않습니다.
- 단일 휴리스틱을 전체 탐색 공간에 적용할 수 있습니다.
현실적인 문제로의 확장
- 더 현실적인 문제는 휴리스틱 탐색의 구현과 분석을 크게 복잡하게 만듭니다.
- 그러나 간단한 게임에서 얻은 통찰력은 전문가 시스템 응용 프로그램과 같은 문제로 일반화될 수 있습니다.
- 현실 문제에서는 단일 휴리스틱이 모든 상태에 적용되지 않을 수 있습니다.
- 각 규칙은 특정 경우에 적용될 수 있는 휴리스틱으로 볼 수 있습니다.
- 패턴 매처(pattern matcher)가 적절한 규칙(휴리스틱)을 관련 상태와 매칭시킵니다
전문가 시스템에서의 휴리스틱 적용
- 전문가 시스템은 주로 if-then 규칙을 사용하여 지식을 표현합니다
- 추론 엔진은 현재 지식 베이스의 상태를 평가하고, 관련 규칙을 적용하여 새로운 지식을 추론합니다
- 전진 추론(forward chaining)과 후진 추론(backward chaining)을 사용하여 결론을 도출합니다
휴리스틱의 한계와 도전
- 지식 베이스의 크기가 증가함에 따라 처리 복잡성이 증가합니다
- 규칙 간의 일관성 검증이 어려워집니다
- 규칙의 우선순위 설정과 모호성 해결이 필요합니다
휴리스틱 평가의 장단점
- 장점: 빠르고 비용 효율적인 방법으로 사용성 문제를 식별할 수 있습니다
- 단점: 주관적이며 실제 사용자의 특정 요구를 완전히 반영하지 못할 수 있습니다

휴리스틱 함수의 세 가지 중요한 특성인 허용성(Admissibility), 단조성(Monotonicity), 정보성(Informedness)에 대해 설명드리겠습니다.

허용성 (Admissibility)

허용성은 휴리스틱 함수가 목표 상태까지의 실제 비용을 절대 과대평가하지 않는 특성을 말합니다.

정의: 모든 노드 n에 대해 h(n) ≤ h*(n)이 성립해야 합니다. 여기서 h(n)은 휴리스틱 추정치이고, h*(n)은 실제 최적 비용입니다
장점:
1. 최적 해를 보장합니다.
2. A* 알고리즘과 같은 탐색 알고리즘의 최적성을 보장합니다

허용성의 중요성

1. 최적해 보장: 허용적인 알고리즘은 항상 최적의 해결책을 찾습니다.
2. 완전성: 해가 존재한다면 반드시 찾아냅니다.
3. 효율성: 불필요한 탐색을 줄일 수 있습니다.
예시: 8-퍼즐 문제에서 "제자리에 있지 않은 타일의 수"를 휴리스틱으로 사용하는 경우, 이는 허용적입니다

단조성 (Monotonicity)

단조성은 휴리스틱 함수가 로컬하게 일관성을 유지하는 특성을 말합니다.

정의: 모든 노드 n과 그의 후속 노드 n'에 대해 h(n) ≤ cost(n, n') + h(n')가 성립해야 합니다
특징:
1. 경로를 따라 f 값(g+h)이 절대 감소하지 않습니다.
2. 각 상태에 도달할 때 최소의 g(n) 값을 가집니다

단조성의 특징

1. 지역적 허용성: 탐색 중 만나는 각 상태에 대해 일관되게 최소 경로를 찾습니다.
2. 경로 재검사 불필요: 최선 우선 탐색에서 새 경로가 더 짧은지 확인할 필요가 없습니다.
3. f 값의 단조 증가: f(n) = g(n) + h(n)이 경로를 따라 단조 증가합니다.
4. 허용성 보장: 모든 단조적 휴리스틱은 허용적입니다.

단조성의 장점

1. 효율성: 노드 재방문이 불필요하여 탐색 효율이 높아집니다.
2. 일관성: 탐색 과정에서 일관된 결과를 제공합니다.
3. 구현 용이성: 알고리즘 구현이 더 간단해집니다.
장점: A* 알고리즘의 효율성을 높이며, 이미 방문한 노드를 다시 고려할 필요가 없게 합니다

정보성 (Informedness)

정보성은 휴리스틱 함수가 얼마나 정확하고 유용한 정보를 제공하는지를 나타냅니다.

정의: 더 정보적인 휴리스틱은 목표까지의 실제 비용에 더 가까운 추정치를 제공합니다
특징:
1. 더 정보적인 휴리스틱은 탐색 공간을 더 효과적으로 줄일 수 있습니다.
2. 최적 경로 주변으로 탐색을 더 집중시킵니다
트레이드오프: 정보성이 높을수록 계산 비용이 증가할 수 있습니다.

결론

허용성은 최적해를 보장하지만, 때로는 비효율적일 수 있습니다.
단조성은 알고리즘의 효율성을 높이며, 모든 단조적 휴리스틱은 허용적입니다
정보성은 탐색 효율성을 높이지만, 계산 비용과의 균형을 고려해야 합니다.

복잡성 문제와 관련된 주요 개념들에 대해 자세히 설명드리겠습니다.

1. 분기 계수 (Branching Factor)

정의: 탐색 공간에서 각 상태에서 평균적으로 생성되는 후속 상태의 수공식: T = B + B² + B³ + ... + Bᴸ = B(Bᴸ - 1) / (B - 1)

B: 분기 계수
L: 경로 길이
T: 전체 탐색 상태 수

의미:

분기 계수가 크면 탐색 공간이 급격히 증가합니다.
효율적인 탐색을 위해 분기 계수를 줄이는 것이 중요합니다.

2. Open 및 Closed 리스트의 크기

Open 리스트: 아직 탐색하지 않은 노드들의 집합
Closed 리스트: 이미 탐색한 노드들의 집합관리 방법:

선택적 저장: Open 리스트에 가장 유망한 상태만 저장
- 장점: 더 집중된 탐색 가능
- 단점: 최적 해 또는 유일한 해결책을 놓칠 위험
빔 탐색 (Beam Search):
- 정의: Open 리스트의 크기에 제한을 두는 기법
- 작동 방식: 각 레벨에서 가장 유망한 k개의 노드만 유지
- 장점: 메모리 사용량 감소, 탐색 속도 향상
- 단점: 최적해를 놓칠 가능성 존재

3. 정보성 (Informedness)

정의: 휴리스틱 함수가 제공하는 정보의 질과 양특징:

탐색 효율성: 더 정보적인 휴리스틱일수록 탐색해야 할 공간이 줄어듭니다.
계산 비용: 추가 정보를 얻기 위한 계산 비용이 증가할 수 있습니다.

트레이드오프:

정보성 증가 → 탐색 공간 감소 → 전체 탐색 시간 감소
정보성 증가 → 휴리스틱 계산 비용 증가 → 노드당 처리 시간 증가

최적화 전략:

간단하고 빠른 휴리스틱 사용: 큰 탐색 공간, 빠른 노드 평가
복잡하고 정확한 휴리스틱 사용: 작은 탐색 공간, 느린 노드 평가

알파-베타 가지치기(Alpha-Beta Pruning) 절차에 대해 상세히 설명드리겠습니다.

기존 미니맥스 알고리즘의 한계

두 번의 분석 필요:
- 첫 번째: 지정된 깊이까지 내려가 휴리스틱 적용
- 두 번째: 값을 트리 위로 전파
비효율성: 모든 노드를 평가해야 함

알파-베타 가지치기의 개선사항

탐색과 평가의 결합:
- 깊이 우선 탐색(DFS) 방식으로 진행
- 탐색 중 알파와 베타 값 생성 및 갱신
알파와 베타 값의 특성:
- 알파(α): MAX 플레이어의 최소 보장 점수, 증가만 함
- 베타(β): MIN 플레이어의 최대 허용 점수, 감소만 함

탐색 종료 규칙

MIN 노드에서의 종료:
- 조건: β ≤ α (조상 MAX 노드의 알파 값)
- 의미: 이 경로는 MAX에게 이미 보장된 값보다 나쁨
MAX 노드에서의 종료:
- 조건: α ≥ β (조상 MIN 노드의 베타 값)
- 의미: 이 경로는 MIN에게 이미 허용된 값보다 나쁨

알고리즘 진행 과정

초기화:
- α = -∞, β = +∞로 시작
깊이 우선 탐색:
- 리프 노드까지 내려가며 α, β 갱신
가지치기:
- 종료 규칙 만족 시 해당 가지 탐색 중단
값 전파:
- MAX 레벨: α = max(α, 자식 노드 값)
- MIN 레벨: β = min(β, 자식 노드 값)
최종 선택:
- 루트에서 가장 높은 α 값을 가진 움직임 선택

장점

효율성: 불필요한 노드 평가 제거
깊은 탐색: 같은 시간에 더 깊은 탐색 가능
최적해 보장: 미니맥스와 동일한 결과 도출

주의사항

노드 순서: 좋은 움직임을 먼저 평가할수록 효과적
초기 추정: 정확한 초기 α, β 값이 중요

결론

알파-베타 가지치기는 미니맥스 알고리즘의 효율성을 크게 개선합니다. 탐색과 평가를 결합하고, α와 β 값을 이용해 불필요한 탐색을 줄임으로써, 더 깊은 탐색을 가능하게 합니다. 이는 체스나 오셀로 같은 복잡한 게임에서 강력한 AI 플레이어를 만드는 데 핵심적인 역할을 합니다.

복잡성 문제 해결 방안

휴리스틱 함수 개선:
- 더 정확하고 정보적인 휴리스틱 설계
- 도메인 지식 활용
탐색 알고리즘 최적화:
- 알파-베타 가지치기 사용
- 반복 깊이 증가(Iterative Deepening) 적용
메모리 관리:
- 트랜스포지션 테이블 사용
- 선택적 노드 저장
병렬화:
- 다중 코어/GPU 활용
- 분산 컴퓨팅 적용
근사 해법:
- 몬테카를로 트리 탐색 사용
- 유전 알고리즘 적용

GAME 설명------------------------------------------------------------------------------------------------------------------------------------------------

알파-베타 가지치기는 미니맥스 알고리즘을 최적화한 방법입니다. 이 알고리즘의 주요 목적은 게임 트리 탐색 시 불필요한 노드 탐색을 줄여 계산 효율성을 높이는 것입니다.알고리즘의 주요 특징은 다음과 같습니다:

알파(α)와 베타(β) 값 사용:
- 알파는 최대화 플레이어가 보장할 수 있는 최소 점수
- 베타는 최소화 플레이어가 보장할 수 있는 최대 점수
가지치기:
- 알파 ≥ 베타일 때 더 이상의 탐색이 무의미하므로 해당 가지를 제거
깊이 우선 탐색:
- 트리를 깊이 우선으로 탐색하며 알파와 베타 값을 갱신
최적화:
- 불필요한 노드 탐색을 줄여 계산 시간과 메모리 사용을 크게 줄임

미니맥스 알고리즘은 완전 탐색 가능한 그래프에서 2인용 게임의 최적 전략을 찾는 데 사용되는 중요한 알고리즘입니다. 이에 대해 자세히 설명드리겠습니다.

미니맥스 알고리즘의 개요

목적: 적대적이고 예측 불가능한 상대방이 존재하는 2인용 게임에서 최적의 움직임을 결정합니다.
적용 범위: 상태 공간이 충분히 작아 완전 탐색이 가능한 게임에 적합합니다.
기본 원리: 한 플레이어는 점수를 최대화(MAX)하려 하고, 다른 플레이어는 최소화(MIN)하려 합니다.

알고리즘 작동 방식

게임 트리 생성: 현재 상태에서 가능한 모든 움직임과 그 결과를 트리 형태로 표현합니다.
말단 노드 평가: 게임의 종료 상태에 도달하면 해당 상태의 점수를 계산합니다.
값 역전파:
- MAX 레벨: 자식 노드 중 최대값 선택
- MIN 레벨: 자식 노드 중 최소값 선택
루트까지 반복: 이 과정을 루트 노드까지 반복하여 각 움직임의 최종 평가 값을 결정합니다.
최적 움직임 선택: 루트에서 가장 높은 값을 가진 움직임을 선택합니다.

특징 및 장단점

장점:

완벽한 정보를 가진 게임에서 최적의 전략을 보장합니다.
상대방의 최선의 대응을 가정하므로 안전한 전략을 제공합니다.

단점:

상태 공간이 큰 게임에서는 계산 비용이 매우 높습니다.
실제 상대방이 최적으로 플레이하지 않을 경우 비효율적일 수 있습니다.