슬롯 사이트 추천과: Taouri Wang, 논문 제안
오전 9:30에오전 10시 30분
줌 링크:
https://wpi.zoom.us/j/4833920729?omn=98284733385
회의 ID: 483 392 0729
제목:확률 역학에서 발생하는 고차원 편미분 방정식을 위한 물리학 기반 신경망
요약: 확률론적 역학과 연결된 편미분 방정식은 모델링, 제어 및 최신 최적화에 널리 사용됩니다. 이 연구에서는 확률론적 미분 방정식(SDE)의 밀도에 대한 Fokker-Planck(FP) 방정식과 컨트롤을 사용한 Langevin 확산에 대한 Hamilton-Jacobi-Bellman(HJB) 방정식이라는 두 가지 방정식에 중점을 둡니다. 기존 그리드 기반 수치 솔버는 FP의 경우 무한 도메인 및 밀도 정규화, HJB의 경우 완전 비선형 연산자로 인해 어려움을 겪습니다. 이러한 문제는 높은 차원에서 더욱 악화되었습니다. 고차원 문제에 대한 기존 신경 솔버는 종종 무거운 Monte-Carlo 데이터가 필요하거나, FP의 정규화에 어려움을 겪거나, 계산 비용이 많이 드는 HJB의 정책 반복 루프에 의존하는 경우가 많습니다.
물리학 기반 신경망(PINN)을 기반으로 저는 고차원(3보다 큰 차원)에서 세 가지 작업을 해결합니다. (i) 정상 상태 FP; (ii) 탐색적 HJB와 이를 사용하여 기존 HJB를 근사화합니다. (iii) 상태 의존적 온도를 이용한 Langevin 기반 비볼록 최적화. FP 방정식을 효율적으로 풀기 위해 (a) 효율적인 자동 미분(AD) 기능을 갖춘 텐서 신경망; (b) SDE 안내 수치 지원; (c) 확률 밀도에 대한 정확한 정규화. HJB의 경우 작은 탐색 가중치 λ에 대한 수치적으로 안정적인 체계를 사용하여 잔차에 로그 적분 연산자를 삽입하여 탐색 PDE를 직접(정책 반복 없음) 해결합니다. 결과는 작은 λ에서 고전적인 HJB에 근접합니다. 그런 다음 결과 솔버를 배포하여 Langevin 기반 비볼록 최적화를 위한 상태 종속 온도 일정을 설계합니다.
FP의 경우 6-10차원의 방법은 10% 미만의 상대 오류를 달성합니다. HJB의 경우 현재 실험에서는 우리 방법을 사용한 탐색 솔루션이 작은 λ에서 기존 솔루션과 정확하게 근사한다는 것을 보여줍니다. Langevin 확산을 사용한 예비 실험은 학습된 온도 일정을 사용한 비볼록 최적화에 대한 유망한 성능을 나타냅니다.
나는 두 가지 문제에 대한 위원회의 피드백을 요청합니다: (1) Fokker-Planck 방정식 해결기에 대한 나의 작업; (2) 탐색적 HJB를 위한 수치 솔버의 지속적인 개발과 비볼록 최적화를 위한 상태 의존 온도를 사용하는 Langevin 확산에 대한 적용입니다. (2)의 경우 (a) 탐색 가중치 λ가 0이 될 때 기존 HJB에 대한 수렴 테스트를 통해 고차원 탐색 HJB에 대한 실험을 추가하고 (b) 획득된 상태 종속 온도 및 추가적인 비볼록 최적화 벤치마크를 기반으로 하는 다른 알고리즘 설계를 추가하겠습니다.
논문 위원회:
교수. Zhongqiang Zhang(고문), 슬롯 사이트
교수. Gu Wang, 슬롯 사이트
슬롯 사이트 추천. Xun Li, 홍콩 폴리테크닉 대학교 외부 회원
교수. Marcus Sarkis-Martins, 슬롯 사이트
슬롯 사이트 추천. Jacob Whitehill, 우스터 폴리테크닉 연구소