Նվիրատվություններ Սեպտեմբերի 15 2024 – Հոկտեմբերի 1 2024
Դրամահավաքի մասին
գրքերի որոնում
գրքեր
Նվիրատվություններ:
61.0% իրականացված է
Մուտք գործել
Մուտք գործել
մուտք գործելուց հետո օգտատերերին հասանելի են․
անհատականացված առաջարկություններ
Telegram բոտ
ներբեռնումների պատմությունը
էլ. փոստին կամ Kindle-ին ուղարկումը
հավաքածուների կառավարումը
ընտրյալներին պահպանումը
Անձնական
Գրքերի հարցումներ
Ուսումնասիրում
Z-Recommend
Գրքերի հավաքածու
Ամենահայտնի
Կատեգորիաներ
Մասնակցություն
Աջակցել
Ներբեռնումներ
Litera Library
Նվիրաբերել թղթե գրքեր
Ավելացնել թղթե գրքեր
Search paper books
Իմ LITERA Point-ը
Բանալի բառերի որոնում
Main
Բանալի բառերի որոնում
search
1
강화학습 첫걸음
한빛미디어
아서 줄리아니
학습
보상을
구현
액션을
reward
에이전트는
액션
네트워크
에이전트가
정책
됩니다
import
각
알고리즘
강화학습
sess.run
밴딧
주요
1부
네트워크를
feed_dict
다음과
환경
보상
어드밴티지
에이전트
h_size
sess
tf.placeholder
신경망
타깃
false
이용해
순환
bandit
그리드
딥
에이전트를
에이전트의
shape
tf.float32
값을
같습니다
랜덤한
상태
0.00000000e
액션에
dqn
메타
학
Տարի:
2017
Լեզու:
korean
Ֆայլ:
PDF, 2.55 MB
Ձեր թեգերը:
0
/
0
korean, 2017
2
강화학습 입문 - 파이썬 예제와 함께하는 (OpenAI Gym과 TensorFlow 실습 가이드)
홍릉과학출판사
김승현
,
김태우
,
이정원
,
이주행
상태
다음과
행동
행동을
파이썬
실무
심층강화학습
정책을
import
봅시다
함수를
가치
각
에이전트가
정책
강화학습
몬테카를로
reward
보상을
값을
됩니다
range
tensorflow
레이어
최적
같습니다
게임
보겠습니다
openai
policy
입력
reinforcement
폴리시
학습
network
개의
정의합니다
시간차
gym
출력
니다
콘볼루션
상태에서
rewards
보상
살펴
사용하여
이용하여
에이전트는
엡실론
Տարի:
2020
Լեզու:
korean
Ֆայլ:
PDF, 18.27 MB
Ձեր թեգերը:
0
/
5.0
korean, 2020
1
Հետևեք
այս հղմանը
կամ որոնեք @BotFather բոտը Telegram-ում
2
Ուղարկեք /newbot հրամանը
3
Նշեք ձեր բոտի անունը
4
Նշեք բոտի օգտատիրոջ անունը
5
Պատճենեք վերջին հաղորդագրությունը BotFather-ից և տեղադրեք այն այստեղ
×
×