You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

092 Lesen.ipynb 4.6KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215
  1. {
  2. "cells": [
  3. {
  4. "cell_type": "markdown",
  5. "metadata": {
  6. "pycharm": {
  7. "name": "#%% md\n"
  8. },
  9. "slideshow": {
  10. "slide_type": "slide"
  11. }
  12. },
  13. "source": [
  14. "# Software Entwicklung \n",
  15. "\n",
  16. "## Kapitel 9: IO\n",
  17. "\n",
  18. "### 9.4 Dateien lesen\n",
  19. "\n",
  20. "Bei großen Dateien sollte vom vollständigen Einlesen mittels\n",
  21. "<code>read</code> Abstand genommen werden, weil dann\n",
  22. "der gesamte Dateiinhalt im Speicher gehalten werden muss.\n",
  23. "Vielmehr sollte in diesem Fall der Inhalt sukzessive eingelesen\n",
  24. "werden."
  25. ]
  26. },
  27. {
  28. "cell_type": "markdown",
  29. "metadata": {
  30. "pycharm": {
  31. "name": "#%% md\n"
  32. },
  33. "slideshow": {
  34. "slide_type": "slide"
  35. }
  36. },
  37. "source": [
  38. "Zu diesem Zweck kann <code>read</code> mit einem Parameter\n",
  39. "aufgerufen werden, der die maximale Anzahl Bytes angibt,\n",
  40. "die gelesen werden sollen."
  41. ]
  42. },
  43. {
  44. "cell_type": "code",
  45. "execution_count": null,
  46. "metadata": {
  47. "pycharm": {
  48. "name": "#%%\n"
  49. }
  50. },
  51. "outputs": [],
  52. "source": [
  53. "with open(\"091a Textdatei\", \"r\") as f:\n",
  54. " block_size = 10\n",
  55. " block = f.read(block_size)\n",
  56. "\n",
  57. " while len(block)>0:\n",
  58. " print(block, end='*')\n",
  59. " block = f.read(block_size)"
  60. ]
  61. },
  62. {
  63. "cell_type": "markdown",
  64. "metadata": {
  65. "slideshow": {
  66. "slide_type": "slide"
  67. }
  68. },
  69. "source": [
  70. "Man kann sich das schrittweise Einlesen der Datei mit Hilfe\n",
  71. "eines Schreib-/Lesekopfs vorstellen, der sich\n",
  72. "entlang eines Stroms von Bytes bzw. Zeichen bewegt.\n",
  73. "Jeder Lesevorgang bewegt den Kopf um die Anzahl der\n",
  74. "gelesenen Zeichen vorwärts. Die Position des Kopfs\n",
  75. "innerhalb der Datei kann mittels <code>tell</code>\n",
  76. "ermittelt werden."
  77. ]
  78. },
  79. {
  80. "cell_type": "code",
  81. "execution_count": null,
  82. "metadata": {
  83. "pycharm": {
  84. "name": "#%%\n"
  85. }
  86. },
  87. "outputs": [],
  88. "source": [
  89. "with open(\"091a Textdatei\", \"r\") as f:\n",
  90. " block_size = 10\n",
  91. " block = f.read(block_size)\n",
  92. "\n",
  93. " while len(block)>0:\n",
  94. " print(block, end='')\n",
  95. " pos = f.tell()\n",
  96. " print(f\"<{pos}>\", end='')\n",
  97. " block = f.read(block_size)"
  98. ]
  99. },
  100. {
  101. "cell_type": "markdown",
  102. "metadata": {
  103. "pycharm": {
  104. "name": "#%% md\n"
  105. },
  106. "slideshow": {
  107. "slide_type": "slide"
  108. }
  109. },
  110. "source": [
  111. "Die Position des Schreib-/Lesekopfs lässt sich auch\n",
  112. "durch die Methode <code>seek</code> verändern."
  113. ]
  114. },
  115. {
  116. "cell_type": "code",
  117. "execution_count": null,
  118. "metadata": {
  119. "pycharm": {
  120. "name": "#%%\n"
  121. }
  122. },
  123. "outputs": [],
  124. "source": [
  125. "with open(\"091a Textdatei\", \"r\") as f:\n",
  126. " f.seek(110)\n",
  127. " print(f.read())"
  128. ]
  129. },
  130. {
  131. "cell_type": "markdown",
  132. "metadata": {
  133. "pycharm": {
  134. "name": "#%% md\n"
  135. },
  136. "slideshow": {
  137. "slide_type": "slide"
  138. }
  139. },
  140. "source": [
  141. "Textdateien sind i.d.R. in Zeilen aufgeteilt, die jeweils\n",
  142. "mit einem Zeilenendezeichen abschließen. Die Methode\n",
  143. "<code>readline</code> liest aus einer Textdatein\n",
  144. "die Daten bis zum nächsten Zeilenende."
  145. ]
  146. },
  147. {
  148. "cell_type": "code",
  149. "execution_count": null,
  150. "metadata": {
  151. "pycharm": {
  152. "name": "#%%\n"
  153. }
  154. },
  155. "outputs": [],
  156. "source": [
  157. "with open(\"091a Textdatei\", \"r\") as f:\n",
  158. " line = f.readline()\n",
  159. " while len(line)>0:\n",
  160. " print(line, end='')\n",
  161. " line = f.readline()"
  162. ]
  163. },
  164. {
  165. "cell_type": "markdown",
  166. "metadata": {
  167. "slideshow": {
  168. "slide_type": "slide"
  169. }
  170. },
  171. "source": [
  172. "Diese häufig benötigte Variante des Lesens einer Textdatei\n",
  173. "kann in Python auch mittels einer <code>for</code>-Schleife\n",
  174. "realisiert werden."
  175. ]
  176. },
  177. {
  178. "cell_type": "code",
  179. "execution_count": null,
  180. "metadata": {
  181. "pycharm": {
  182. "name": "#%%\n"
  183. }
  184. },
  185. "outputs": [],
  186. "source": [
  187. "with open(\"091a Textdatei\", \"r\") as f:\n",
  188. " for line in f:\n",
  189. " print(line, end='')"
  190. ]
  191. }
  192. ],
  193. "metadata": {
  194. "celltoolbar": "Slideshow",
  195. "kernelspec": {
  196. "display_name": "Python 3 (ipykernel)",
  197. "language": "python",
  198. "name": "python3"
  199. },
  200. "language_info": {
  201. "codemirror_mode": {
  202. "name": "ipython",
  203. "version": 3
  204. },
  205. "file_extension": ".py",
  206. "mimetype": "text/x-python",
  207. "name": "python",
  208. "nbconvert_exporter": "python",
  209. "pygments_lexer": "ipython3",
  210. "version": "3.9.9"
  211. }
  212. },
  213. "nbformat": 4,
  214. "nbformat_minor": 1
  215. }