HOME | ÃâÆÇ»ç ¼Ò°³ | »ó´ã ¸ÞÀÏ

Áø»ù¹Ìµð¾î °í°´»ó´ã TEL.02-353-4421 FAX.02-353-4431 MAIL. book@jinsaem.co.kr  

µµ¼­ °Ë»ö (by ¼­¸í/ÀúÀÚ/ISBN)



Physical AI·Î ¶°³ª´Â °­È­ÇнÀ ù°ÉÀ½ 2ÆÇ

ÀúÀÚ : ±è¿øÇÏ 

¿ªÀÚ :  

°¡°Ý : \29,000 

ISBN-10 : 1194907039    ISBN-13 : 9791194907039 

ÃâÆÇ»ç : Áø»ù¹Ìµð¾î 

ÃâÆÇ³â : 2025

ÆäÀÌÁö : 238 pages

°ü·ÃÀÚ·á :

ÀÌ Ã¥Àº °­È­ÇнÀÀ» ½ÇÁ¦·Î Àû¿ëÇÏ·Á¸é ¹Ýµå½Ã ¾Ë¾Æ¾ß ÇÒ °­È­ÇнÀÀÇ ±âÃÊ À̷п¡ °üÇÑ °ÍÀÔ´Ï´Ù. ÀÌ Ã¥ÀÇ ¸ñÀûÀº Physical AI¸¦ Àü¹®ÀûÀ¸·Î ¿¬±¸ÇϽ÷Á´Â ºÐµé¿¡°Ô ½ÉÈ­ ¿¬±¸¸¦ À§ÇÑ ±âÃʸ¦ Ãæ½ÇÇÏ°Ô ´ÙÁö°Ô Çϰí, ½Ç¹« °æÇèÀÌ Ç³ºÎÇÑ ºÐµé¿¡°Ô´Â ü°èÀûÀ¸·Î ÀÌ·ÐÀÌ Á¤¸³µÇµµ·Ï ÇÏ´Â °ÍÀÔ´Ï´Ù.

»ý°¢ÀÇ È帧À» ½Ã°¢ÀûÀ¸·Î Ç¥ÇöÇϱâ À§Çؼ­, °¢ »ý°¢ÀÇ ¿ä¼Ò¸¦ ´Ü°èº°·Î ºÐ·ùÇÏ°í ¿¬°áÇÏ¿© µµ½ÄÈ­ÇÏ¿´½À´Ï´Ù. ÀÌ´Â ¿©·¯ºÐµéÀÌ ³í¸®¸¦ Ãß·ÐÇÏ°Ô ÇÏ´Â °Íº¸´Ù´Â üÇèÇÒ ¼ö ÀÖµµ·Ï µµ¿ÍÁÙ °ÍÀÔ´Ï´Ù. ±×·¯¹Ç·Î ÀÌ Ã¥Àº ±×¸²Ã¥¿¡ ´õ °¡±õ½À´Ï´Ù.

¼öÇÐÀÇ È°¿ëÀ» ÃÖ¼ÒÈ­ÇÏ¿© ÇʼöÀûÀÎ ¼öÇи¸ »ç¿ëÇÏ¿´½À´Ï´Ù. °­È­ÇнÀ¿¡¼­ »ç¿ëÇÏ´Â ¼öÇÐÀº °è»êÀ» À§ÇÑ °ÍÀ̱⺸´Ù´Â ÁÖ·Î »óȲÀ» Ç¥ÇöÇϱâ À§ÇÑ ¼öÇÐÀÔ´Ï´Ù. »ç½Ç ÀÌ·¯ÇÑ ¼öÇÐÀÌ ´õ ¾î·Á¿ï ¼ö ÀÖ½À´Ï´Ù. ƯÈ÷ º¯¼ö¿¡ ºÙÀº ÷ÀÚµé ¶§¹®¿¡ óÀ½ ¹è¿ì´Â ºÐµéÀº È¥µ·½º·¯¿ï °ÍÀÔ´Ï´Ù. ¾î·Æ°í È¥¶õ½º·¯¿î ¼öÇÐÀÌ Àü°³µÉ ¶§¸¶´Ù Ãæ½ÇÈ÷ ¼³¸íÇÏ°í ¸íÈ®ÇÏ°Ô ÇÏ¿© Ãʺ¸Àںе鵵 ÀÌ·ÐÀ» ½±°Ô ÀÌÇØÇÒ ¼ö ÀÖµµ·Ï ÇÏ¿´½À´Ï´Ù

¿¹Á¦µéÀ» ÀÌ·ÐÀ» üÇèÇϵµ·Ï ¸¸µé¾î¼­, ÀÌ Ã¥À» °øºÎÇϽô ºÐµéÀÌ ÀÌ·ÐÀ» ÀÌÇØ¸¦ ³Ñ¾î¼­ ´À³¢µµ·Ï ÇÏ¿´½À´Ï´Ù. 

 

CHAPTER 1. °­È­ÇнÀ µÑ·¯º¸±â
1.1 °­È­ÇнÀÀÇ ¸ñÀû
1.2 °­È­ÇнÀÀÇ ¿ä¼Ò
1.3 °­È­ÇнÀÀÇ ¼øÂ÷Àû °úÁ¤
1.4 °­È­ÇнÀÀÇ ÇнÀ¹æ¹ý Â÷º°¼º

CHAPTER 2. °­È­ÇнÀ ¸ðµ¨¸µ
2.1 MDP ȯ°æ ¸ðµ¨¸µ
2.2 MDPÀÇ °­È­ÇнÀ ¸ðµ¨¸µ
2.3 °­È­ÇнÀ ¹®Á¦ ºÐ·ù
2.4 ¿ä¾à ¹× Á¤¸®

CHAPTER 3. Bellman ¹æÁ¤½Ä
3.1 Bellman ±â´ë ¹æÁ¤½Ä
3.2 Bellman ÃÖÀû ¹æÁ¤½Ä
3.3 ¿ä¾à ¹× Á¤¸®

CHAPTER 4. ȯ°æÀ» ¾Ë ¶§ °­È­ÇнÀ : Planning
4.1 Model ±â¹Ý °­È­ÇнÀ
4.2 ¹Ýº¹Àû Á¤Ã¥ Æò°¡(Iterative Policy Evalution)
4.3 Á¤Ã¥ ¹Ýº¹(Policy Iteration)
4.4 °¡Ä¡ ¹Ýº¹(Value Iteration)
4.5 ¿ä¾à ¹× Á¤¸®

CHAPTER 5. ȯ°æÀ» ¸ð¸¦ ¶§ °­È­ÇнÀ I : Prediction
5.1 Monte Carlo(MC) ¹æ¹ý
5.2 MC ±â¹Ý ¿¡ÇǼҵå ÇнÀ
5.3 Model-Free Prediction
5.4 Prediction ±â¹ý ºÐ¼®
5.5 ¿ä¾à ¹× Á¤¸®

CHAPTER 6. ȯ°æÀ» ¸ð¸¦ ¶§ °­È­ÇнÀ II : Control
6.1 Action-value ÇÔ¼ö¸¦ Ȱ¿ëÇÑ Learning
6.2 Control
6.3 Control ¾Ë°í¸®Áò
6.4 ÀÚÀ² ÁÖÇà ·Îº¿ÀÇ °æ·Î ã±â
6.5 Python Code: Gridworld
6.5 ¿ä¾à ¹× Á¤¸®

CHAPTER 7. ȯ°æ ±Ù»çÈ­
7.1 ȯ°æ ±Ù»çÈ­ Çʿ伺
7.2 ȯ°æ ±Ù»çÈ­ ÇÔ¼ö
7.3 ½Å°æ¸Á(Neural Network)

CHAPTER 8. Value ±â¹Ý °­È­ÇнÀ
8.1 Agent ºÐ·ù
8.2 Value Network ÇнÀ
8.3 Deep Q-Network(DQN)
8.4 Python Code : Cartpole
8.5 ¿ä¾à ¹× Á¤¸®

CHAPTER 9. Policy ±â¹Ý °­È­ÇнÀ
9.1 Deterministic policy¿Í stochastic policy
9.2 Policy Network ÇнÀ
9.3 Actor-Critic
9.4 Python Code ±¸Çö : Cartpole
9.5 ¿ä¾à ¹× Á¤¸® 

 

±è¿øÇÏ °æÈñ´ëÇб³ 

 



5 28 ȣ Ʈ 102 5ȣ
TEL. (02) 353-4421 FAX. (02) 353-4431
EMAIL. book@jinsaem.co.kr