Articial Intelligence 중요특허 3(2)
실시 형태2
【0157】<실시 형태 2>도 40은 실시 형태 2에 대한 반도체 장치 1 a가 탑재된 반도체 시스템 SYS1a의 구성 예를 나타내는 블록도이다. 도 40에 나타내는 반도체 장치 1 a는 도 1에 나타내는 반도체 장치 1과 비교하여 DRP11를 대신하여 DRP11a를 구비한다.
【0158】 DRP11a는 예를 들면 2개의 상태 관리부(STC;State Transition Controller) 111,112를 가지며, 한쪽의 상태 관리부 111을 이용하여 외부 메모리 3에서 읽어내진 데이터에 대해서 연산 처리를 해 그 처리 결과를 가속기 12를 향해서 출력함과 동시에, 다른 한쪽의 상태 관리부 112를 이용하여 가속기 12에서 출력된 데이터에 대해서 연산 처리를 해 그 처리 결과를 외부 메모리 3에 기록하고 있다.
즉 DRP11a는 가속기 12로 송신하는 데이터의 처리와 가속기 12로부터 수신한 데이터의 처리를 각각 독립적으로 작동시키고 있다. 그것에 의해, DRP11a에서는 DRP11의 경우보다 동적 재구성을 실행할 때 주어지는 동작 명령(애플리케이션)을 더욱 간단한 것으로 할 수 있다. 또한 그로 인해 DRP11a는 DRP11의 경우보다 용이하게 회로의 재구성을 수행하는 것이 가능해진다.
【0159】
또한 DRP11a는 가속기 12로 송신하는 데이터의 처리와 가속기 12로부터 수신한 데이터의 처리를 각각 독립적으로 작동시키는 2개의 상태 관리부를 구비함으로써, 예를 들면 외부 메모리 3에서 읽어내진 데이터가 입력되는 외부 입력 단자, 가속기 12를 향한 데이터가 출력되는 외부 출력 단자, 가속기 12로부터의 데이터가 입력되는 외부 입력 단자 및 외부 메모리 3을 향한 쓰기 데이터가 출력되는 외부 출력 단자의 배치의 자유도를 향상시킬 수 있다.
【0160】
이상과 같이 상기 실시 형태 1,2에 걸리는 반도체 장치는 병렬로 연산 처리를 하는 병렬 연산기를 가지는 가속기와 데이터의 주고받음을 순차 수행하는 DRP 등의 데이터 처리부와 가속기에 의한 복수의 연산 처리 결과를 순서대로 선택해 데이터 처리부에 대해서 출력하는 데이터 전송부를 구비한다. 그것에 의해, 상기 실시 형태 1,2에 걸리는 반도체 장치 및 그것을 구비한 반도체 시스템은 대량이 규칙적인 데이터 처리에 대해서는 가속기를 이용하여 수행해 또한 그 이외의 데이터 처리에 대해서는 데이터 처리부를 이용하여 수행할 수 있기 때문에, 예를 들면 딥 러닝 처리 등의 대규모 연산 처리 두어도 효율이 좋은 연산 처리를 실현할 수 있다.
【0162】
상기 실시 형태 1,2에서는 병렬 연산부 121을 구성하는 복수의 연산기에 대해서 로컬 메모리 122에서 읽어내진 개별 소정 데이터가 각각 공급될 경우에 대해 설명했으나, 이에 한정되지 않는다.
병렬 연산부 121을 구성하는 복수의 연산기 전부 또는 그룹에 대해서 로컬 메모리 122에서 읽어내진 공통의 소정 데이터가 공급되어 있어도 좋다. 이 경우, 로컬 메모리 122의 회로 규모 및 소비 전력을 감소시키는 것이 가능해진다.