ರೋಬೋಟ್‌ಗಳಿಗೆ ವರ್ಚುವಲ್ ತರಬೇತಿ ಮೈದಾನಗಳನ್ನು ವೈವಿಧ್ಯಗೊಳಿಸಲು ಉತ್ಪಾದಕ AI ಅನ್ನು ಬಳಸುವುದು

ಚಾಟ್‌ಜಿಪಿಟಿ ಮತ್ತು ಕ್ಲೌಡ್‌ನಂತಹ ಚಾಟ್‌ಬಾಟ್‌ಗಳು ಕಳೆದ ಮೂರು ವರ್ಷಗಳಲ್ಲಿ ಬಳಕೆಯಲ್ಲಿ ಉಲ್ಕಾಪಾತದ ಏರಿಕೆಯನ್ನು ಕಂಡಿವೆ ಏಕೆಂದರೆ ಅವುಗಳು ವ್ಯಾಪಕ ಶ್ರೇಣಿಯ ಕಾರ್ಯಗಳಲ್ಲಿ ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತವೆ. ನೀವು ಷೇಕ್ಸ್‌ಪಿಯರ್‌ನ ಸಾನೆಟ್‌ಗಳನ್ನು ಬರೆಯುತ್ತಿರಲಿ, ಡೀಬಗ್ ಮಾಡುವ ಕೋಡ್ ಅಥವಾ ಅಸ್ಪಷ್ಟ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರದ ಅಗತ್ಯವಿರಲಿ, AI ವ್ಯವಸ್ಥೆಗಳು ನಿಮ್ಮನ್ನು ಆವರಿಸಿರುವಂತೆ ತೋರುತ್ತವೆ. ಈ ಬಹುಮುಖತೆಯ ಮೂಲ? ಇಂಟರ್ನೆಟ್‌ನಲ್ಲಿ ಶತಕೋಟಿ ಅಥವಾ ಟ್ರಿಲಿಯನ್‌ಗಟ್ಟಲೆ ಪಠ್ಯದ ಡೇಟಾ ಪಾಯಿಂಟ್‌ಗಳು.

ಈ ಡೇಟಾವು ಸಾಕಾಗುವುದಿಲ್ಲ, ಆದಾಗ್ಯೂ, ರೋಬೋಟ್ ಅನ್ನು ಮನೆಯ ಅಥವಾ ಫ್ಯಾಕ್ಟರಿ ಸಹಾಯಕರಾಗಿ ಕಲಿಸಲು. ವಿವಿಧ ಪರಿಸರದಲ್ಲಿ ವಸ್ತುಗಳ ವಿವಿಧ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಹೇಗೆ ಕುಶಲತೆಯಿಂದ ಜೋಡಿಸುವುದು, ಜೋಡಿಸುವುದು ಮತ್ತು ಇರಿಸುವುದು ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು, ರೋಬೋಟ್‌ಗಳಿಗೆ ಪ್ರಾತ್ಯಕ್ಷಿಕೆಗಳ ಅಗತ್ಯವಿದೆ. ಕಾರ್ಯದ ಪ್ರತಿ ನಡೆಯ ಮೂಲಕ ಸಿಸ್ಟಂಗಳಿಗೆ ಮಾರ್ಗದರ್ಶನ ನೀಡುವ ವಿವರಣೆ ನೀಡುವ ವೀಡಿಯೊಗಳ ಸಂಗ್ರಹವಾಗಿ ರೋಬೋಟ್ ತರಬೇತಿ ಡೇಟಾವನ್ನು ನೀವು ಯೋಚಿಸಬಹುದು. ನೈಜ ರೋಬೋಟ್‌ಗಳಲ್ಲಿ ಈ ಡೆಮೊಗಳನ್ನು ಸಂಗ್ರಹಿಸುವುದು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಸಂಪೂರ್ಣವಾಗಿ ಪುನರಾವರ್ತನೆಯಾಗುವುದಿಲ್ಲ, ಆದ್ದರಿಂದ ಇಂಜಿನಿಯರ್‌ಗಳು AI ಸಿಮ್ಯುಲೇಶನ್‌ಗಳನ್ನು ರಚಿಸುವ ಮೂಲಕ ತರಬೇತಿ ಡೇಟಾವನ್ನು ರಚಿಸಿದ್ದಾರೆ (ಇದು ಸಾಮಾನ್ಯವಾಗಿ ನೈಜ ಭೌತಶಾಸ್ತ್ರವನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವುದಿಲ್ಲ) ಅಥವಾ ಮೊದಲಿನಿಂದ ಪ್ರತಿ ಡಿಜಿಟಲ್ ಪರಿಸರವನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ರಚಿಸುತ್ತದೆ.

MITಯ ಕಂಪ್ಯೂಟರ್ ಸೈನ್ಸ್ ಮತ್ತು ಆರ್ಟಿಫಿಶಿಯಲ್ ಇಂಟೆಲಿಜೆನ್ಸ್ ಲ್ಯಾಬೊರೇಟರಿ (CSAIL) ಮತ್ತು ಟೊಯೋಟಾ ರಿಸರ್ಚ್ ಇನ್‌ಸ್ಟಿಟ್ಯೂಟ್‌ನ ಸಂಶೋಧಕರು ರೋಬೋಟ್‌ಗಳಿಗೆ ಅಗತ್ಯವಿರುವ ವೈವಿಧ್ಯಮಯ ಮತ್ತು ವಾಸ್ತವಿಕ ತರಬೇತಿ ಮೈದಾನಗಳನ್ನು ರಚಿಸಲು ಒಂದು ಮಾರ್ಗವನ್ನು ಕಂಡುಕೊಂಡಿದ್ದಾರೆ. ಅವರ “ಓರಿಯೆಂಟಬಲ್ ದೃಶ್ಯ ರಚನೆ” ವಿಧಾನವು ಅಡುಗೆಮನೆಗಳು, ವಾಸದ ಕೋಣೆಗಳು ಮತ್ತು ರೆಸ್ಟೋರೆಂಟ್‌ಗಳಂತಹ ವಸ್ತುಗಳ ಡಿಜಿಟಲ್ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುತ್ತದೆ, ಇದನ್ನು ಎಂಜಿನಿಯರ್‌ಗಳು ನೈಜ-ಪ್ರಪಂಚದ ಸಂವಹನಗಳು ಮತ್ತು ಸನ್ನಿವೇಶಗಳನ್ನು ಅನುಕರಿಸಲು ಬಳಸಬಹುದು. ಟೇಬಲ್‌ಗಳು ಮತ್ತು ಪ್ಲೇಟ್‌ಗಳಂತಹ ವಸ್ತುಗಳ ಮಾದರಿಗಳಿಂದ ತುಂಬಿದ 44 ಮಿಲಿಯನ್‌ಗಿಂತಲೂ ಹೆಚ್ಚು 3D ಕ್ಯಾಮೆರಾಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ಈ ಉಪಕರಣವು ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಸ್ವತ್ತುಗಳನ್ನು ಹೊಸ ದೃಶ್ಯಗಳಾಗಿ ಇರಿಸುತ್ತದೆ, ನಂತರ ಪ್ರತಿಯೊಂದನ್ನು ಭೌತಿಕವಾಗಿ ನಿಖರವಾದ, ವಾಸ್ತವಿಕ ಪರಿಸರಕ್ಕೆ ಪರಿಷ್ಕರಿಸುತ್ತದೆ.

ಡೈರೆಕ್ಷನಲ್ ದೃಶ್ಯ ರಚನೆಯು ಪ್ರಸರಣ ಮಾದರಿಯನ್ನು “ಪಾಯಿಂಟ್” ಮಾಡುವ ಮೂಲಕ ಈ 3D ಪ್ರಪಂಚಗಳನ್ನು ರಚಿಸುತ್ತದೆ – ಯಾದೃಚ್ಛಿಕ ಶಬ್ದದಿಂದ ದೃಶ್ಯ ಚಿತ್ರವನ್ನು ರಚಿಸುವ AI ವ್ಯವಸ್ಥೆ – ನೀವು ದೈನಂದಿನ ಜೀವನದಲ್ಲಿ ಕಂಡುಬರುವ ದೃಶ್ಯಕ್ಕೆ. ಸಂಶೋಧಕರು ಈ ಉತ್ಪಾದಕ ವ್ಯವಸ್ಥೆಯನ್ನು ಪರಿಸರವನ್ನು “ಬಣ್ಣ” ಮಾಡಲು ಬಳಸಿದರು, ದೃಶ್ಯದ ಉದ್ದಕ್ಕೂ ಕೆಲವು ಅಂಶಗಳನ್ನು ತುಂಬಿದರು. ಖಾಲಿ ಕ್ಯಾನ್ವಾಸ್ ಇದ್ದಕ್ಕಿದ್ದಂತೆ 3D ವಸ್ತುಗಳಿಂದ ಆವೃತವಾದ ಅಡುಗೆಮನೆಯಾಗಿ ಬದಲಾಗುವುದನ್ನು ನೀವು ಊಹಿಸಬಹುದು, ಅದು ಕ್ರಮೇಣ ನೈಜ ಭೌತಶಾಸ್ತ್ರವನ್ನು ಅನುಕರಿಸುವ ದೃಶ್ಯವಾಗಿ ಮರುಹೊಂದಿಸಲಾಗುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಫೋರ್ಕ್ ಮೇಜಿನ ಮೇಲಿರುವ ಬೌಲ್ ಮೂಲಕ ಹೋಗುವುದಿಲ್ಲ ಎಂದು ಸಿಸ್ಟಮ್ ಖಚಿತಪಡಿಸುತ್ತದೆ – “ಕ್ಲಿಪ್ಪಿಂಗ್” ಎಂದು ಕರೆಯಲ್ಪಡುವ 3D ಗ್ರಾಫಿಕ್ಸ್‌ನಲ್ಲಿನ ಸಾಮಾನ್ಯ ದೋಷ, ಅಲ್ಲಿ ಮಾದರಿಗಳು ಅತಿಕ್ರಮಿಸುತ್ತವೆ ಅಥವಾ ಛೇದಿಸುತ್ತವೆ.

ಆದಾಗ್ಯೂ, ಓರಿಯಂಟಬಲ್ ದೃಶ್ಯ ರಚನೆಯು ಅದರ ಸೃಷ್ಟಿಯನ್ನು ನೈಜತೆಯ ಕಡೆಗೆ ಹೇಗೆ ಮಾರ್ಗದರ್ಶನ ಮಾಡುತ್ತದೆ ಎಂಬುದನ್ನು ನೀವು ಆಯ್ಕೆ ಮಾಡುವ ತಂತ್ರವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. ಇದರ ಮುಖ್ಯ ಕಾರ್ಯತಂತ್ರವೆಂದರೆ “ಮಾಂಟೆ ಕಾರ್ಲೋ ಟ್ರೀ ಸರ್ಚ್” (MCTS), ಅಲ್ಲಿ ಮಾದರಿಯು ಹಲವಾರು ಪರ್ಯಾಯ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುತ್ತದೆ, ನಿರ್ದಿಷ್ಟ ಗುರಿಯತ್ತ ವಿಭಿನ್ನ ರೀತಿಯಲ್ಲಿ ಅವುಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸುತ್ತದೆ (ಉದಾಹರಣೆಗೆ ಹೆಚ್ಚು ಭೌತಿಕವಾಗಿ ನೈಜ ದೃಶ್ಯವನ್ನು ಮಾಡುವುದು ಅಥವಾ ಸಾಧ್ಯವಾದಷ್ಟು ಖಾದ್ಯ ಅಂಶಗಳನ್ನು ಸೇರಿಸುವುದು). ಗೋದಲ್ಲಿ (ಚೆಸ್ ತರಹದ ಆಟ) ಮಾನವ ಎದುರಾಳಿಗಳನ್ನು ಸೋಲಿಸಲು AI ಪ್ರೋಗ್ರಾಂ ಆಲ್ಫಾಗೋ ಇದನ್ನು ಬಳಸುತ್ತದೆ ಏಕೆಂದರೆ ವ್ಯವಸ್ಥೆಯು ಹೆಚ್ಚು ಅನುಕೂಲಕರವಾದದನ್ನು ಆಯ್ಕೆ ಮಾಡುವ ಮೊದಲು ಚಲನೆಗಳ ಸಂಭಾವ್ಯ ಅನುಕ್ರಮಗಳನ್ನು ಪರಿಗಣಿಸುತ್ತದೆ.

“ದೃಶ್ಯ ರಚನೆಯ ಕಾರ್ಯವನ್ನು ಅನುಕ್ರಮ ನಿರ್ಧಾರ-ಮಾಡುವ ಪ್ರಕ್ರಿಯೆಯಾಗಿ ರೂಪಿಸುವ ಮೂಲಕ ದೃಶ್ಯ ಉತ್ಪಾದನೆಗೆ MCTS ಅನ್ನು ಅನ್ವಯಿಸಲು ನಾವು ಮೊದಲಿಗರಾಗಿದ್ದೇವೆ” ಎಂದು MIT ಯ ಎಲೆಕ್ಟ್ರಿಕಲ್ ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ಎಂಜಿನಿಯರಿಂಗ್ ವಿಭಾಗದ (EECS) ಪಿಎಚ್‌ಡಿ ವಿದ್ಯಾರ್ಥಿ ನಿಕೋಲಸ್ ಪಿಫಾಫ್ ಹೇಳುತ್ತಾರೆ, ಅವರು CSAIL ಸಂಶೋಧಕರು ಮತ್ತು ಕೃತಿಯನ್ನು ಪ್ರಸ್ತುತಪಡಿಸುವ ಕಾಗದದ ಪ್ರಮುಖ ಲೇಖಕರು. “ನಾವು ಕಾಲಾನಂತರದಲ್ಲಿ ಉತ್ತಮ ಅಥವಾ ಹೆಚ್ಚು ಅಪೇಕ್ಷಣೀಯ ದೃಶ್ಯಗಳನ್ನು ನಿರ್ಮಿಸಲು ಭಾಗಶಃ ದೃಶ್ಯಗಳ ಮೇಲೆ ನಿರ್ಮಿಸುವುದನ್ನು ಮುಂದುವರಿಸುತ್ತೇವೆ. ಪರಿಣಾಮವಾಗಿ, MCTS ಪ್ರಸರಣ ಮಾದರಿಯು ತರಬೇತಿ ಪಡೆದಿರುವುದಕ್ಕಿಂತ ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುತ್ತದೆ.”

ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವ ಪ್ರಯೋಗದಲ್ಲಿ, MCTS ಸರಳವಾದ ರೆಸ್ಟೋರೆಂಟ್ ದೃಶ್ಯಕ್ಕೆ ಗರಿಷ್ಠ ಸಂಖ್ಯೆಯ ವಸ್ತುಗಳನ್ನು ಸೇರಿಸಿತು. ಸರಾಸರಿ 17 ಐಟಂಗಳೊಂದಿಗೆ ಹಂತಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ನಂತರ ಅವರು ಮಂದವಾದ ಭಕ್ಷ್ಯಗಳ ಬೃಹತ್ ಸ್ಟ್ಯಾಕ್ಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಮೇಜಿನ ಮೇಲೆ 34 ವಸ್ತುಗಳನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಿದರು.

ಓರಿಯಂಟಬಲ್ ದೃಶ್ಯ ಉತ್ಪಾದನೆಯು ಬಲವರ್ಧನೆಯ ಕಲಿಕೆಯ ಮೂಲಕ ವಿವಿಧ ತರಬೇತಿ ಸನ್ನಿವೇಶಗಳನ್ನು ಸೃಷ್ಟಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ – ಪ್ರಾಯೋಗಿಕ ಮತ್ತು ದೋಷದ ಮೂಲಕ ಗುರಿಯನ್ನು ಸಾಧಿಸಲು ಪ್ರಸಾರ ಮಾದರಿಯನ್ನು ಮೂಲಭೂತವಾಗಿ ಕಲಿಸುತ್ತದೆ. ಆರಂಭಿಕ ಡೇಟಾದ ತರಬೇತಿಯ ನಂತರ, ನಿಮ್ಮ ಸಿಸ್ಟಮ್ ಎರಡನೇ ಹಂತದ ತರಬೇತಿಯ ಮೂಲಕ ಹೋಗುತ್ತದೆ, ಅಲ್ಲಿ ನೀವು ಪ್ರತಿಫಲವನ್ನು ರೂಪಿಸುತ್ತೀರಿ (ಮೂಲತಃ, ನೀವು ಆ ಗುರಿಗೆ ಎಷ್ಟು ಹತ್ತಿರವಾಗಿದ್ದೀರಿ ಎಂಬುದನ್ನು ಸೂಚಿಸುವ ಸ್ಕೋರ್‌ನೊಂದಿಗೆ ಬಯಸಿದ ಫಲಿತಾಂಶ). ಮಾದರಿಯು ಹೆಚ್ಚಿನ ಸ್ಕೋರ್‌ಗಳೊಂದಿಗೆ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸಲು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಕಲಿಯುತ್ತದೆ, ಆಗಾಗ್ಗೆ ಅದು ತರಬೇತಿ ಪಡೆದ ಸನ್ನಿವೇಶಗಳಿಗಿಂತ ಭಿನ್ನವಾದ ಸನ್ನಿವೇಶಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತದೆ.

ಬಳಕೆದಾರರು ನಿರ್ದಿಷ್ಟ ದೃಶ್ಯ ವಿವರಣೆಗಳನ್ನು ಟೈಪ್ ಮಾಡುವ ಮೂಲಕ ನೇರವಾಗಿ ಸಿಸ್ಟಮ್ ಅನ್ನು ಪ್ರಶ್ನಿಸಬಹುದು (ಉದಾಹರಣೆಗೆ “ನಾಲ್ಕು ಸೇಬುಗಳನ್ನು ಹೊಂದಿರುವ ಅಡಿಗೆ ಮತ್ತು ಮೇಜಿನ ಮೇಲಿರುವ ಬೌಲ್”). ನಂತರ, ಸ್ಟೀರಬಲ್ ದೃಶ್ಯ ಉತ್ಪಾದನೆಯು ನಿಮ್ಮ ವಿನಂತಿಗಳನ್ನು ನಿಖರವಾಗಿ ಜೀವಂತಗೊಳಿಸಬಹುದು. ಉದಾಹರಣೆಗೆ, ಪರಿಕರವು ಪ್ಯಾಂಟ್ರಿ ಶೆಲ್ಫ್ ದೃಶ್ಯಗಳನ್ನು ನಿರ್ಮಿಸುವಾಗ 98% ಮತ್ತು ಗೊಂದಲಮಯ ಉಪಹಾರ ಕೋಷ್ಟಕಗಳಿಗಾಗಿ 86% ದರದಲ್ಲಿ ಬಳಕೆದಾರರ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ನಿಖರವಾಗಿ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ. “MiDiffusion” ಮತ್ತು “DiffuScene” ನಂತಹ ಹೋಲಿಸಬಹುದಾದ ವಿಧಾನಗಳಿಗಿಂತ ಎರಡೂ ಶ್ರೇಣಿಗಳು ಕನಿಷ್ಠ 10% ಸುಧಾರಣೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುತ್ತವೆ.

ವ್ಯವಸ್ಥೆಯು ಬೆಳಕಿನ ಸೂಚನೆಗಳು ಅಥವಾ ನಿರ್ದೇಶನಗಳ ಮೂಲಕ ನಿರ್ದಿಷ್ಟ ದೃಶ್ಯಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಬಹುದು (ಉದಾಹರಣೆಗೆ “ಒಂದೇ ವಸ್ತುಗಳನ್ನು ಬಳಸಿಕೊಂಡು ವಿಭಿನ್ನ ದೃಶ್ಯ ವ್ಯವಸ್ಥೆಯೊಂದಿಗೆ ಬನ್ನಿ”). ಅಡಿಗೆ ಮೇಜಿನ ಮೇಲೆ ಹಲವಾರು ಪ್ಲೇಟ್ಗಳಲ್ಲಿ ಸೇಬುಗಳನ್ನು ಇರಿಸಲು ನೀವು ಅವನನ್ನು ಕೇಳಬಹುದು, ಉದಾಹರಣೆಗೆ, ಅಥವಾ ಬೋರ್ಡ್ ಆಟಗಳು ಮತ್ತು ಕಾರ್ಡ್ಗಳನ್ನು ಶೆಲ್ಫ್ನಲ್ಲಿ ಇರಿಸಿ. ಮೂಲಭೂತವಾಗಿ, ಇದು ಖಾಲಿ ಜಾಗಗಳಲ್ಲಿ ಅಂಶಗಳನ್ನು ಇರಿಸುವ ಮೂಲಕ ಆದರೆ ಉಳಿದ ದೃಶ್ಯವನ್ನು ಇರಿಸುವ ಮೂಲಕ “ಖಾಲಿ ಜಾಗವನ್ನು ತುಂಬುವುದು”.

ಸಂಶೋಧಕರ ಪ್ರಕಾರ, ಅವರ ಯೋಜನೆಯ ಶಕ್ತಿಯು ರೊಬೊಟಿಕ್‌ಗಳು ನಿಜವಾಗಿ ಬಳಸಬಹುದಾದ ಅನೇಕ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುವ ಸಾಮರ್ಥ್ಯದಲ್ಲಿದೆ. “ನಮ್ಮ ಸಂಶೋಧನೆಗಳ ಪ್ರಮುಖ ಒಳನೋಟವೆಂದರೆ ನಾವು ಮೊದಲೇ ತರಬೇತಿ ಪಡೆದ ದೃಶ್ಯಗಳು ನಾವು ನಿಜವಾಗಿಯೂ ಬಯಸಿದ ದೃಶ್ಯಗಳಂತೆ ನಿಖರವಾಗಿ ಕಾಣಿಸದಿರುವುದು ಸರಿಯಾಗಿದೆ,” Pfaff ಹೇಳುತ್ತಾರೆ. “ನಮ್ಮ ಸ್ಟೀರಿಂಗ್ ವಿಧಾನಗಳನ್ನು ಬಳಸಿಕೊಂಡು, ನಾವು ಆ ವಿಶಾಲ ವಿತರಣೆ ಮತ್ತು ಮಾದರಿಯನ್ನು ‘ಉತ್ತಮ’ ಒಂದರಿಂದ ಆಚೆಗೆ ಚಲಿಸಬಹುದು. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ವೈವಿಧ್ಯಮಯ, ವಾಸ್ತವಿಕ ಮತ್ತು ಕಾರ್ಯ-ಜೋಡಣೆಯ ದೃಶ್ಯಗಳನ್ನು ನಾವು ನಿಜವಾಗಿಯೂ ನಮ್ಮ ರೋಬೋಟ್‌ಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ಬಯಸುತ್ತೇವೆ.”

ಅಂತಹ ವಿಶಾಲವಾದ ದೃಶ್ಯಗಳು ವಿವಿಧ ಅಂಶಗಳೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸುವ ವರ್ಚುವಲ್ ರೋಬೋಟ್ ಅನ್ನು ರೆಕಾರ್ಡ್ ಮಾಡಲು ಪರೀಕ್ಷಾ ಮೈದಾನಗಳಾಗಿವೆ. ಯಂತ್ರವು ಫೋರ್ಕ್‌ಗಳು ಮತ್ತು ಚಾಕುಗಳನ್ನು ಕಟ್ಲರಿ ಹೋಲ್ಡರ್‌ನಲ್ಲಿ ಎಚ್ಚರಿಕೆಯಿಂದ ಇರಿಸಿತು, ಉದಾಹರಣೆಗೆ, ವಿವಿಧ 3D ಸೆಟ್ಟಿಂಗ್‌ಗಳಲ್ಲಿ ಪ್ಲೇಟ್‌ಗಳಲ್ಲಿ ಬ್ರೆಡ್ ಅನ್ನು ಮರುಹೊಂದಿಸಿತು. ಪ್ರತಿಯೊಂದು ಸಿಮ್ಯುಲೇಶನ್ ದ್ರವ ಮತ್ತು ವಾಸ್ತವಿಕವಾಗಿ ಕಾಣಿಸಿಕೊಂಡಿತು, ನೈಜ ಪ್ರಪಂಚದಂತೆಯೇ, ಹೊಂದಾಣಿಕೆಯ ರೋಬೋಟ್‌ಗಳ ಓರಿಯಂಟಬಲ್ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುವುದು ತರಬೇತಿಯಲ್ಲಿ ಒಂದು ದಿನ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ರೋಬೋಟ್‌ಗಳಿಗೆ ಹೆಚ್ಚು ವೈವಿಧ್ಯಮಯ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಉತ್ಪಾದಿಸಲು ವ್ಯವಸ್ಥೆಯು ಪ್ರೋತ್ಸಾಹದಾಯಕ ಮಾರ್ಗವಾಗಿದ್ದರೂ, ಸಂಶೋಧಕರು ಅವರ ಕೆಲಸವು ಪರಿಕಲ್ಪನೆಯ ಪುರಾವೆಯಾಗಿದೆ ಎಂದು ಹೇಳುತ್ತಾರೆ. ಭವಿಷ್ಯದಲ್ಲಿ, ಸ್ವತ್ತುಗಳ ಸ್ಥಿರ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸುವ ಬದಲು ಸಂಪೂರ್ಣವಾಗಿ ಹೊಸ ವಸ್ತುಗಳು ಮತ್ತು ದೃಶ್ಯಗಳನ್ನು ರಚಿಸಲು ಅವರು ಉತ್ಪಾದಕ AI ಅನ್ನು ಬಳಸಲು ಬಯಸುತ್ತಾರೆ. ದೃಶ್ಯಗಳನ್ನು ಇನ್ನಷ್ಟು ಸಂವಾದಾತ್ಮಕವಾಗಿಸಲು ರೋಬೋಟ್ ತೆರೆಯಬಹುದಾದ ಅಥವಾ ತಿರುಗಿಸಬಹುದಾದ (ಉದಾಹರಣೆಗೆ ಕಪಾಟುಗಳು ಅಥವಾ ಆಹಾರದಿಂದ ತುಂಬಿದ ಜಾಡಿಗಳಂತಹ) ಸ್ಪಷ್ಟವಾದ ವಸ್ತುಗಳನ್ನು ಸಂಯೋಜಿಸಲು ಅವರು ಯೋಜಿಸಿದ್ದಾರೆ.

ತಮ್ಮ ವರ್ಚುವಲ್ ಪರಿಸರವನ್ನು ಇನ್ನಷ್ಟು ನೈಜವಾಗಿಸಲು, Pfaff ಮತ್ತು ಅವರ ಸಹೋದ್ಯೋಗಿಗಳು ಇಂಟರ್ನೆಟ್ ಚಿತ್ರಗಳಿಂದ ಎಳೆದ ವಸ್ತುಗಳು ಮತ್ತು ದೃಶ್ಯಗಳ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ನೈಜ-ಪ್ರಪಂಚದ ವಸ್ತುಗಳನ್ನು ಸಂಯೋಜಿಸಬಹುದು ಮತ್ತು “ಸ್ಕೇಲೆಬಲ್ ರಿಯಲ್2ಸಿಮ್” ನಲ್ಲಿ ಅವರ ಹಿಂದಿನ ಕೆಲಸವನ್ನು ಬಳಸುತ್ತಾರೆ. AI-ನಿರ್ಮಿತ ರೋಬೋಟ್ ಪರೀಕ್ಷಾ ಮೈದಾನಗಳು ಎಷ್ಟು ವೈವಿಧ್ಯಮಯ ಮತ್ತು ವಾಸ್ತವಿಕವಾಗಿರಬಹುದು ಎಂಬುದನ್ನು ವಿಸ್ತರಿಸುವ ಮೂಲಕ, ದತ್ತಾಂಶದ ಸಂಪತ್ತನ್ನು ರಚಿಸುವ ಬಳಕೆದಾರರ ಸಮುದಾಯವನ್ನು ನಿರ್ಮಿಸಲು ತಂಡವು ಆಶಿಸುತ್ತಿದೆ, ನಂತರ ಅದನ್ನು ಬುದ್ಧಿವಂತ ರೋಬೋಟ್‌ಗಳಿಗೆ ವಿವಿಧ ಕೌಶಲ್ಯಗಳನ್ನು ಕಲಿಸಲು ಬೃಹತ್ ಡೇಟಾ ಸೆಟ್ ಆಗಿ ಬಳಸಬಹುದು.

“ಇಂದು, ಸಿಮ್ಯುಲೇಶನ್‌ಗಾಗಿ ನೈಜ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುವುದು ತುಂಬಾ ಕಷ್ಟಕರವಾದ ಪ್ರಯತ್ನವಾಗಿದೆ; ಕಾರ್ಯವಿಧಾನದ ಪೀಳಿಗೆಯು ಸುಲಭವಾಗಿ ಹೆಚ್ಚಿನ ಸಂಖ್ಯೆಯ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸಬಹುದು, ಆದರೆ ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ರೋಬೋಟ್ ಎದುರಿಸುವ ಪರಿಸರದ ಪ್ರತಿನಿಧಿಯಾಗಿರುವುದಿಲ್ಲ. ಕಸ್ಟಮ್ ದೃಶ್ಯಗಳನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ರಚಿಸುವುದು ಸಮಯ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ದುಬಾರಿಯಾಗಿದೆ,” ಅಮೆಜಾನ್‌ನ ಅನ್ವಯಿಕ ರೊಬೊಟಿಕ್ಸ್ ತಜ್ಞ ಜೆರೆಮಿ ಬೈನಾಸಿಂಟಿಸ್ಟ್ ಹೇಳುತ್ತಾರೆ. “ಓರಿಯಂಟಬಲ್ ದೃಶ್ಯ ರಚನೆಯು ಉತ್ತಮ ವಿಧಾನವನ್ನು ನೀಡುತ್ತದೆ: ಪೂರ್ವ ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ದೃಶ್ಯಗಳ ದೊಡ್ಡ ಸಂಗ್ರಹದ ಮೇಲೆ ಉತ್ಪಾದಕ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಿ ಮತ್ತು ಅದನ್ನು (ಬಲವರ್ಧನೆಯ ಕಲಿಕೆಯಂತಹ ತಂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು) ನಿರ್ದಿಷ್ಟ ಕೆಳಗಿರುವ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಅಳವಡಿಸಿಕೊಳ್ಳಿ. ಹಿಂದಿನ ಕೆಲಸಕ್ಕೆ ಹೋಲಿಸಿದರೆ ಆಫ್-ದಿ-ಶೆಲ್ಫ್ ದೃಷ್ಟಿ-ಭಾಷೆಯ ಮಾದರಿಯನ್ನು ಬಳಸುತ್ತದೆ ಅಥವಾ ವಸ್ತುಗಳನ್ನು ಜೋಡಿಸುವುದರ ಮೇಲೆ ಮಾತ್ರ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ.

“ತರಬೇತಿ-ನಂತರದ ತರಬೇತಿ ಮತ್ತು ನಿರ್ಣಯ-ಸಮಯದ ಹುಡುಕಾಟದೊಂದಿಗೆ ಶ್ರೇಣೀಕರಿಸಬಹುದಾದ ದೃಶ್ಯ ಉತ್ಪಾದನೆಯು ದೃಶ್ಯ ಉತ್ಪಾದನೆಯನ್ನು ಪ್ರಮಾಣದಲ್ಲಿ ಸ್ವಯಂಚಾಲಿತಗೊಳಿಸಲು ಹೊಸ ಮತ್ತು ಪರಿಣಾಮಕಾರಿ ಚೌಕಟ್ಟನ್ನು ಒದಗಿಸುತ್ತದೆ” ಎಂದು ಟೊಯೋಟಾ ರಿಸರ್ಚ್ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ರೋಬೋಟಿಸ್ಟ್ ರಿಕ್ ಕೋರಿ SM ’08, PhD ’10 ಹೇಳುತ್ತಾರೆ, ಅವರು ಕೆಲಸದಲ್ಲಿ ತೊಡಗಿಸಿಕೊಂಡಿಲ್ಲ. “ಇದಲ್ಲದೆ, ಡೌನ್‌ಸ್ಟ್ರೀಮ್ ಕಾರ್ಯಗಳಿಗೆ ಮುಖ್ಯವೆಂದು ಪರಿಗಣಿಸಲಾದ ‘ಎಂದಿಗೂ-ನೋಡದ’ ದೃಶ್ಯಗಳನ್ನು ಇದು ರಚಿಸಬಹುದು. ಭವಿಷ್ಯದಲ್ಲಿ, ಈ ಚೌಕಟ್ಟನ್ನು ಇಂಟರ್ನೆಟ್‌ನಿಂದ ವ್ಯಾಪಕವಾದ ಡೇಟಾದೊಂದಿಗೆ ಸಂಯೋಜಿಸುವುದು ನೈಜ-ಪ್ರಪಂಚದ ಅನುಷ್ಠಾನಕ್ಕಾಗಿ ಪರಿಣಾಮಕಾರಿ ರೋಬೋಟ್ ತರಬೇತಿಯತ್ತ ಪ್ರಮುಖ ಹೆಜ್ಜೆಯನ್ನು ಅನ್ಲಾಕ್ ಮಾಡಬಹುದು.”

Pfaff ಪ್ರಮುಖ ಲೇಖಕ ರಸ್ ಟೆಡ್ರೇಕ್, ಟೊಯೋಟಾ ಪ್ರೊಫೆಸರ್ ಆಫ್ ಎಲೆಕ್ಟ್ರಿಕಲ್ ಮತ್ತು ಕಂಪ್ಯೂಟರ್ ಇಂಜಿನಿಯರಿಂಗ್, ಏರೋನಾಟಿಕ್ಸ್ ಮತ್ತು ಆಸ್ಟ್ರೋನಾಟಿಕ್ಸ್, ಮತ್ತು MIT ಯಲ್ಲಿ ಮೆಕ್ಯಾನಿಕಲ್ ಇಂಜಿನಿಯರಿಂಗ್ ಜೊತೆ ಬರೆದರು; ಟೊಯೋಟಾ ಸಂಶೋಧನಾ ಸಂಸ್ಥೆಯಲ್ಲಿ ದೊಡ್ಡ ವರ್ತನೆಯ ಮಾದರಿಗಳ ಹಿರಿಯ ಉಪಾಧ್ಯಕ್ಷ; ಮತ್ತು CSAIL ಪ್ರಧಾನ ತನಿಖಾಧಿಕಾರಿ. ಇತರ ಲೇಖಕರು ಟೊಯೋಟಾ ರಿಸರ್ಚ್ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ರೊಬೊಟಿಕ್ಸ್ ಸಂಶೋಧಕ ಹಾಂಗ್ಕೈ ಡೈ SM ’12, PhD ’16; ತಂಡದ ನಾಯಕ ಮತ್ತು ಪ್ರಧಾನ ತನಿಖಾಧಿಕಾರಿ ಸೆರ್ಗೆ ಜಖರೋವ್; ಮತ್ತು ಶುನ್ ಇವಾಸೆ, ಕಾರ್ನೆಗೀ ಮೆಲಾನ್ ವಿಶ್ವವಿದ್ಯಾಲಯದಲ್ಲಿ ಪಿಎಚ್‌ಡಿ ವಿದ್ಯಾರ್ಥಿ. ಅವರ ಕೆಲಸವನ್ನು ಅಮೆಜಾನ್ ಮತ್ತು ಟೊಯೋಟಾ ರಿಸರ್ಚ್ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ಭಾಗಶಃ ಬೆಂಬಲಿಸಿದೆ. ಸೆಪ್ಟೆಂಬರ್‌ನಲ್ಲಿ ನಡೆದ ಕಾನ್ಫರೆನ್ಸ್ ಆನ್ ರೋಬೋಟ್ ಲರ್ನಿಂಗ್ (CoRL) ನಲ್ಲಿ ಸಂಶೋಧಕರು ತಮ್ಮ ಕೆಲಸವನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಿದರು.

Related Posts

Leave a Reply Cancel reply