본문 바로가기

논문 리뷰

[RK-DCRNN] Runge–Kutta Type Discrete Circadian RNN for Resolving Tri-Criteria Optimization Scheme of Noises Perturbed Redundant Robot Manipulators 논문 리뷰-ing

728x90
반응형

 

 

해당 논문 링크 : https://ieeexplore.ieee.org/document/9199289 

 

 

0. Abstract

 

로봇 하드웨어나 환경의 주기적인 방해에 저항하기 위해 RK-DCRNN 모델을 제안하고, 중복 로봇 조작기의 동작을 계획하기 위해 조사하였다. [1] 최적의 제어를 달성하기 위해 먼저 이차 프로그래밍 기반의 ALHT(Acceleration-Level Hybrid Tri-criteria) 체계를 설계하여 가속도 규범, 토크 규범, 관절각 무변위 지수를 동시에 최소화하는 방법을 제안했다. [2] neural dynamic 설계 방법에 따라 연속 시간 일주기 리듬 신경망 모델을 활용했다. 그리고 룬지-쿠타 수치 미분법을 기반으로 이로부터 이산 시간 일주기 리듬 신경망 모델을 얻는다. [3] 상세산 수학적 도출을 통해 제안된 RK-DCRNN 모델의 수렴을 증명한다. [4] 비교 시뮬레이션과 물리적 실험을 한다. 이를 통해 제안된 모델이 manipulator의 모션 플래닝에서 위치 오차의 누적을 억제할 수 있음을 확인한다. 

-> 색인 용어: Motion planning, Neural Networks, periodic noises, redundant robot manipulators, Runge-Kuttad numerical differential method

 

1. Introduction

 

여분의 관절을 가진 로봇 매니퓰레이터는 다양한 현실 세게에 점점 더 많이 적용되고 있다. 최근에는 이러한 로봇의 모션 플래닝 문제를 해결하기 위해 다양한 신경망이 활용되고 있다. 연구자들은 컴퓨팅의 병렬성과 적응성 때문에 신경망을 유용한 도구로 선호한다. 선행 연구들로 인해 일반적으로 신경망을 사용하여 semi-define 프로그래밍 문제, 이차 프로그래밍 문제, 영점 찾기 문제와 같은 최적화 및 행렬 함수 문제를 해결하는 것이 실행 가능하고 효율적이라고 밝혀졌다. 또다른 연구에서는 QP 문제, 시간 가변 Sylvester 방정식, 로봇 모션 플래닝, 무인 항공기를 해결하기 위한 가변 파라미터 수렴-미분 신경망을 제안했으며, 이는 시간 가변하는 파라미터를 가지고 있다. 

디지털 기술의 급속한 발전으로 인해 많은 로봇들이 컴퓨터로 제어된다. 따라서 컴퓨터에서 수행할 수 있고, 최적화 방법을 통해 로봇 동작 계획 문제를 해결할 수 있는 이산 시간형 신경망은 점점 더 중요해지고 있다. 시간 가변 비선형 최적화, 비선형 블록 최적화 등이 이에 해당한다. 

실제 적용 땐 하드웨어 오류, 전기 회로 장비 소음, 장비 작동 소음, 외부 주변 소음은 항상 존재하며 이에 대한 저항이 필요하다. 로봇 매니퓰레이터 모션 플래닝에서 낮은 잡음 정도는 항상 예상된다. 해결 방안들은 주로 디지털 필터 또는 일부 전통적 방법을 사용하여 노이즈에 저항하는데, 그 방안 중 하나로 최근 신경망이 선호되고 있다. 예를 들어, 잡음이 있는 역행렬을 해결하기 위해 다양한 활성화 함수를 가진 ZNN이 제안되었다. 그 외에도 동적 비선형 방정식의 잡음을 해결하기 위해 비선형 신경 역학, 리아푸노프 방정식을 풀기 위해 신경 역학을 제로화하는 절차, 듀얼 매니퓰레이터 제어 과정에서 발생하는 주기적 잡음을 억제하기 위한 이중 신경망 등이 개발되었다. 하지만 이러한 신경망은 더 복잡한 주기적 잡음은 무시하곤 한다. 또한 이러한 신경망은 모두 연속 시간 모델이지만, 대부분 실제 응용 분야는 디지털 컴퓨터의 제어를 받는다. 컴퓨터 제어 이론에 따르면 디지털 이산화 과정은 컴퓨터의 제어에 필수적이다. 따라서 시스템을 조종하기 위해 연속 제어 법칙을 직접 부과하는 것은 적절하지 않다. 본 논문에서는 여분의 관절을 가진 로봇 매니퓰레이터의 잡음이 교란된 모션 플래닝 문제를 해결하기 위해 RK-DCRNN 모델을 제안한다. 

-> 더 복잡한 주기적 잡음으로는 감쇠 정현파 잡음, 임펄스 잡음, 직사각형파 잡음, 사다리꼴파 잡음 등이 있다. 

-> RK-DCRNN란 룬지-쿠타형 이산시간 일주기 리듬 신경망, Runge-Kutta discrete-time circacian rhythms neural network를 의미한다. 

지난 연구들은 로봇 최적화 방식을 속도 레벨에서 활용하였다. 그러나 이러한 방식에 의해 생성된 솔루션은 속도 벡터로, 가속도나 토크에 의해 구동되는 로봇을 직접 제어할 수 없다. 가속도-토크 기반 모션 플래닝과 기법을 활용하는 것이 시급하다. 본 논문에서는 가속도 규범, 토크 규범, 관절각 무편위 지수를 동시에 최소화할 수 있는 ALHT 기법을 제안한다. 

-> ALHT(Acceleration-level hybrid tri-criteria)란? 가속도-토크 하이브리드 삼기준 기법을 의미한다. 

이 글의 나머지 부분은 5개의 섹션으로 나뉜다. 섹션 2에서는 토크와 가속도를 고려한 3가지 기준의 최적화 체계가 공식화된다. 또한 RK-DCRNN 모델을 제안하고 도출한다.섹션 3에서는 이론적 분석과 실험을 통해 해당 모델의 수렴 성능을 증명한다. 시뮬레이션과 물리적 실험은 각각 섹션 4, 5에서 설명한다. 섹션 6은 이 글의 결론이다. 아래는 전체 요약본이다. 

[1] RK-DCRNN 모델을 제안한다. 해당 모델은 매니퓰레이터 하드웨어나 환경의 주기적인 간섭에 저항할 수 있는 여분의 관절을 가진 로봇의 동작을 계획한다는 목적을 가진다.

[2] 가속도 규범, 토크 규범, 관절 각도 무변위 지수를 동시에 최소화하는 이차 프로그래밍 기반 ALHT 기법을 활용한다. 

[3] RK-DCRNN 모델의 수렴을 자세히 증명한다. 수렴을 기반으로 해당 모델의 정상 상태 잔차 오차는 O4)임을 증명할 수 있다. 

[4] RK-DCRNN 모델와 RK-DZNN 모델 간의 비교 시뮬레이션 및 실험을 통해 제안된 RK-DCRNN 모델이 더 강력한 노이즈 방지 능력을 가지고 있음을 알 수 있다. 

 

 

2. Problem Formulation and Neural Network models

 

이 섹션에서는 redundant robot manipulator의 forward kinematic problem에 대해 설명한다. 그런 다음, ALHT 체계해당 이산 시간 체계에 대해 설명한다. 

 

(1) Forward Kinematics Equation and ALHT Scheme

redundant robot의 순방향 운동학 방정식은 다음과 같이 공식화된다.

 

 

r(t) ∈ Rm이고, θ ∈ Rm이다. 이들은 각각 end effector 위치 벡터와 조인트 각도 벡터를 나타낸다. 함수 f(·)는 부드러운 비선형 함수를 나타낸다. 이 함수는 manipulator의 매개변수로부터 얻을 수 있고, m은 엔드 이펙터의 Cartesian coordinate dimension을 나타내고 n은 자유도(DOF)의 수를 의미한다. 

-> Cartesian coordinate dimension이란? 공간 내에서 위치를 나타내는 좌표 체계 중 하나로, 2D 공간의 경우에는 평면 상의 x축과 y축으로, 3D 공간의 경우에는 공간 상의 x축 y축 그리고 z축으로 나뉜다. 

함수 f(·)의 비선형으로 인해 직접 역 운동학 해를 구하는 것은 매우 어렵다. 

 

 

바로 위의 식처럼 맨 처음 식을 선형 처리하는 효과적인 방법이 있다.

 

 

J(θ ) = ∂f(θ )/∂θ ∈ Rm x n는 redundant robot manipulator의 자코비안 행렬이다. 그리고 θ'(t), θ''(t), r''(t)는 각각 각도-속도 벡터, 관절-각도 가속도 벡터, 엔드이펙터 가속도 벡터를 나타낸다. 그러나 이 로봇은 주어진 엔드이펙터 기본 작업을 완료하는데 필요한 DOF보다 더 많은 DOF를 가지므로 θ''(t)의 해는 무한대이다. (즉 n>m이다. 이는 로봇의 엔드 이펙터가 closed-path를 완료한 후 관절이 초기 상태로 돌아간다는 보장이 없다는 의미) 따라서 모션 플래닝 방식은 관절 드리프트 문제를 해결해야 한다. 또한 관절 가속도 및 토크의 급격한 변화는 예상되지 않으므로, 계획에서 고려해야 한다. 이러한 문제들을 해결하기 위해 ALHT 계획은 아래와 같이 공식화된다. 

-> 자코비안 행렬(Jacobian matrix)이란? 비선형 변환을 선형 변환으로 근사시킨 행렬이다. 

 

ALHT scheme

 

여기서 σ ∈ [0, 1]는 가중치 계수를 나타내며, a(t)와 α와 β는 모두 양수 가중치다. v는 조인트 토크 벡터를 의미한다. 또한 θ와 θ'는 θ(t), θ'(t)의 약어다. M(θ) ∈ Rn×n 은 관성 행렬을 나타낸다. C(θ, θ') ∈ Rn 는 원심력 또는 코리올리 힘 벡터를 나타낸다. M(θ) ∈ Rn 는 중력 벡터를 나타내고, λa ∈ R 및 λb ∈ R은 피드백 제어 계수다. 위 식들은 평등 제약 조건에 따라 QP 문제로 다시 작성할 수 있다. 

 

ALHT scheme를 QP문제로 작성

 

여기서 위첨자 T는 전치 행렬임을 나타내는 기호이고, J는 J(θ)의 약어다. 

-> QP 문제란? 제약 조건이 있는 이차 최적화 문제. 목표는 목적 함수를 최소화하는 x를 찾음과 동시에 제약 조건을 모두 만족해야 한다. 

 

(2) Continuous-Time CRNN Model

첫째로, 이 모델은 CNN과 RNN을 결합하여 시계열 데이터에서 패턴을 추출한다. CNN의 연산을 먼저 한 뒤에 각 채널을 나눠서 RNN에 입력한다. 즉 CNN을 통해 특징을 추출하고, 이를 RNN으로 분류하는 흐름이다. 관련 논문에선 CNN을 통해 입력 이미지로부터 특징을 추출하고, 추출한 일렬의 특징들을 RNN에 입력하여 예측하고, 예측된 텍스트 시퀀스를 텍스트로 변환하였다. 

-> lagrangian function이란? 최적화 문제에서 제약 조건이 있는 문제를 해결하기 위한 도구 중 하나다. 일반적으로 최적화 문제는 [1] 최소화하려는 목적 함수, [2] 최적화하려는 변수에 대한 제약 조건으로 정의된다. 라그랑주 함수는 이러한 최적화 문제에서 목적 함수와 제약 조건을 결합한 함수이다. 이 함수는 제약 조건이 있는 최적화 문제를 제약 조건이 없는 문제로 변환한다. 

 

ALHT scheme를 QP문제로 작성
QP문제의 라그랑주 함수
라그랑주 함수의 1차 도함수

 

위의 라그랑주 함수에서 λ(t) ∈ Rm 는 라그랑주 승수 벡터를 나타낸다. 또한 라그랑주 함수의 1차 도함수는 아래의 행렬 형태로 변환될 수 있다. 

 

행렬 방정식

 

행렬 A(t)를 어떤 순간에도 비쌍곡선으로 두기 위해, Q(t)와 J가 임의의 순간 t ∈ [t, +∞) 에 모두 full rank라고 가정하자. 이렇게 되면 행렬 방정식의 해는 유일해진다. 따라서 ALHT scheme를 푸는 것은 행렬 방정식의 해를 구하는 것으로 변환된다. 간단히 하기 위해 A(t), B(t)와 X(t)는 A, B, X로 약칭하며 오차 방정식은 아래처럼 공식화할 수 있다. 

 

error equation

 

둘째로, neural dynamic은 아래처럼 형성된다.

 

neural dynamic
compensation matrix

 

ω(t) ∈ Rn+m 는 다양한 주기적 노이즈를 나타낸다. 그리고 γ(>0) 은 수렴 속도를 스케일링한다. φ(t) ∈ Rn+m 는 보정 행렬로, 위의 두번째 식이다. 여기서 T는 노이즈 ω(t)의 주기, ρ(>0) 은 피드백 계수다. 아래는 4가지 주기적 노이즈에 대한 설명이다. 

 

(a) Damped sinusoids noises. (b) Impulse noises. (c) Rectangular wave noises. (d) Trapezoidal wave noises.

 

셋째로, error equation을 neural dynamic에 대입하면 continuous-time CRNN 모델의 암시적 동역학 방정식은 다음과 같이 공식화된다. 

 

an implicit dynamical equation
another form

 

여기서 X' = dX/dt, A' = dA/dt, B' = dB/dt이다. 그 아래 식은 변환된 형태로, A-1는 A의 역행렬을 의미한다. 

 

(3) Runge–Kutta Type Discrete CRNN Model

 

 

가정1 : 고전적인 4차 룬지쿠타 수치 미분 방법은 다음과 같이 공식화된다. 위의 공식 기반으로 이산형 CRNN 모델을 구하자. 아래 공식은 룬지쿠타 타입의 discrete-time CRNN 모델이다. 

 

 

여기서 τ는 샘플링 주기를 나타내고, Xn는 정확한 솔루션 X(nτ)의 추정치다. 

 

(4) Continuous-Time ZNN Model and Discrete-Time ZNN Model

앞서 언급한 neural dynamic 공식에 따르면, continuous-time ZNN은 아래처럼 공식화된다. 

-> ZNN이란? 

 

neural dynamic
continuous-time ZNN model

 

유사하게, Xn+1 도 구할 수 있다. 

 

 

 

3. Theoretical Analysis and Results

 

내용

 

(1) Theorem 

내용

 

(2) Threorem

내용

 

(3) Threorem

내용

 

 

4. Simulations and Experiment Verification

 

내용

 

 

5. Physical Experiment Verification

 

 

내용

 

 

6. Conclusion

 

내용

 

 

 

 

728x90
반응형