Git系列之底层原理篇

Git系列之底层原理篇,第1张

本章节是Git的核心知识点,主要是介绍Git底层原理与在使用Git过程中的几个重要区域,弄懂Git的整个使用流程,以及数据的存储过程。

工作区(Working Directory):

工作区就是我们平时编写文本文件的地方

暂存区(Stage/Index):

暂存区是我们提交文本文件到本地仓库的来源地,只有把工作区的文件添加至暂存区,才可以被提交至本地仓库。

本地仓库(Repository):

本地仓库是保存每次文件更新的记录,包括提交人,提交时间,提交的内容等详细信息,方便追溯历史版本。

远程仓库(Remote Repository):

远程仓库算是本地仓库的一个副本,主要是方便合作伙伴之间的仓库文件同步。

因此它的使用流程可以简单的概括为:

1、在本地搭建一个目录,用来创建git仓库

$ git init gitDirectory

2、在仓库目录下创建文本文件(工作区)

$ cd gitDirectory

$ echo "first txt" > firsttxt

3、把工作区的firsttxt文件添加至git暂存区

$ git add firsttxt

4、将暂存区中的文件firsttxt提交至本地仓库

$ git commit -m "first commit"

5、将文件保存至本地仓库就已经可以记录我们每次提交的历史信息了,但是为了方便其他伙伴一起协作,还需要搭建一个远程服务。(本次以GitHub为例)

在GitHub创建一个和本地一样名称的仓库,创建成功后会生成一个仓库地址:

https://githubcom/mr-kings/gitDirectorygit

6、将本地仓库和远程仓库关联起来

$ git remote add origin https://githubcom/mr-kings/gitDirectorygit

7、第一次将本地仓库提交至远程仓库

$ git push -u origin master

第一次需要添加 -u 参数,即把本地的master分支和远程仓库的master分支对应上

8、此时本地仓库和远程仓库就已经实现了同步,其他协作伙伴只需到远程仓库把仓库克隆到自己的电脑即可进行协作编辑

$ git clone https://githubcom/mr-kings/gitDirectorygit

9、克隆下来以后会在本地生成本地仓库以及工作区,后续的操作和2步骤及以后步骤一致

需要注意的是:远程仓库有两种连接方式https/ssh,上面的例子使用的https,其实ssh方式会比https快的多,它还可以通过添加密钥的方式省去每次提交时都要输入用户名和密码的问题,这里不做详细介绍。https也是可以通过配置省去每次推送都需要输入用户名和密码的问题。

Git安装成功后,在本地新建一个Git仓库,$ git init Gitstudy会生成一个git文件夹,如果你创建的时候没有发现git目录那应该是你的电脑默认隐藏了git文件夹,有两种方式可以查看它:

第一种方式:

命令行工具,在当前目录下,在命令行里输入 $ ll -a 即可查看

第二种方式:

在当前目录下,菜单,然后勾选上隐藏的项目即可

git目录就是暂存区和本地仓库的位置,所以它的核心就在这里,下面看看它有哪些内容:

由上图可知,初始化的时候git目录下有以下文件及文件夹:

config(文件):存放当前仓库的一些配置信息,比如记住用户名和密码,别名等

下面是它的常用选项:

[core] ignorecase 是否忽略文件大小写

[remote "origin"] url 配置远程仓库地址

[remote "origin"] fetch 远程分支映射关系

[user] name 用户名

[user] email 邮箱

[alias] 命令别名配置 : cmt = commit

description(文件):创建仓库的描述文件

HEAD(文件):指示当前被检出(所在)的分支,如当前在test分支,文件内容则为ref: refs/heads/test。

hooks/(文件夹):包含客户端或服务端的钩子脚本(hook scripts),如pre-commit,post-receive等

info/ (文件夹):用以存储一些有关git仓库的信息,如exclude

objects/ (文件夹):用以存储git仓库中的所有数据内容

refs/(文件夹):包含 heads 文件夹,remote文件夹。heads 记录本地相关的各 git分支操作记录,remote 记录远程仓库相关的各git分支 操作记录

当第一次提交的时候还会生成以下文件及文件夹:

index (文件) -- (在git add file的时候生成):是当前版本的文件索引,包含生成当前树(唯一确定的)对象的所虚信息,可用于快速比对工作树和其他提交树对象的差异(各commit和HEAD之间的diff),可用于存储单文件的多个版本以有效的解决合并冲突。可使用git ls-files 查看index文件内容

COMMIT_EDITMSG(文件) -- (在git commit -m "first commit"的时候生成):最近一次的 commit edit message

logs/ (文件夹) -- (在git commit -m "first commit"的时候生成):放置git仓库操作记录的文件夹,包含HEAD文件 和 refs文件夹

以上简单介绍了git目录下的文件及文件夹,重点则是objects文件夹:

经过第一次提交后objects文件夹下多出了3个文件夹:44/、d0/、f6/。通过提交的日志我们发现,commit后会生成一个40位的16进制字符串(前两位作为文件夹名称,后38位为内容哈希值)

官方描述:这是一个 SHA-1 哈希值——一个将待存储的数据外加一个头部信息(header)一起做 SHA-1 校验运算而得的校验和(前2位作为文件夹名称 -- 后面38位作为内容的哈希值)

通过cat-file -t sha-1 命令查看当前哈希值所属的类型:

由图可知它是一个commit对象

再通过命令cat-file -p sha-1查看该commit对象包含有哪些信息

由图知一个commit对象包含了tree对象,本地仓库信息,提交人信息及提交时的备注信息。

再通过上述命令查看tree对象又包含又哪些信息:

由图知tree对象又包含了blob对象,在多目录的情况下tree对象还会包含其他tree对象。

由此得出结论:刚才提交的时候生成的那个3个文件夹分别对应的是3个对象即:44/文件夹对应的是commit对象,f6/文件夹对应的是tree对象,d0/文件夹对应的是blob对象。层级关系是:commit对象对应一个tree对象,tree对象可以包含一个或多个其他tree对象和blob对象。

下面就简单介绍git中的几个对象:

blob:

blob对象只跟文本文件的内容有关,和文本文件的名称及目录无关,只要是相同的文本文件,会指向同一个blob。

tree:

tree对象记录文本文件内容和名称、目录等信息,每次提交都会生成一个顶层tree对象,它可以指向其引用的tree或blob。

commit:

commit对象记录本次提交的所有信息,包括提交人、提交时间,本次提交包含的tree及blob。

tag:

标签引用,它指向某一个commit。

用下面的图可以把今天的内容概括起来:上半部分描述了git的操作流程图,下半部分描述git底层数据存储结构图

Git流程及底层结构图

下面就对图的下半部分做个详细说明:

1、在与git同级目录下新建文件夹directory,再在directory目录下新建一个文本文件firsttxt,里面的内容为1。当执行$ git add firsttxt 的时候就会在git/objects/生成一个blob对象的文件夹(前两位为文件夹名称 -- 后38位为文本内容的哈希值)对应上图的第一个d00491 -- blob对象。

2、当执行$ git commit -m "first commit" 的时候就会在git/objects/下新生成了2个tree对象和一个commit对象的文件夹(前两位为文件夹名称 -- 后38位为文本内容的哈希值)对应上图的f6589b -- tree对象,4a2e3e -- tree对象,6b18a7 -- commit对象。之所以生成两个tree对象是因为directory目录为一个tree对象还有与commit对象一一对应的顶层tree对象。这个时候HEAD游标指向的是当前master分支的first commit。并且在这次提交的时候打个v10版本的标签。

3、在与git同级目录下新建一个新的文本文件secondtxt,内容为2。当执行$ git add secondtxt 的时候就会在git/objects/生成一个新的blob对象的文件夹(前两位为文件夹名称 -- 后38位为文本内容的哈希值)对应上图的0cfbf0 -- blob对象。

4、当执行$ git commit -m "second commit" 的时候就会在git/objects/下新生成了1个tree对象和一个commit对象的文件夹(前两位为文件夹名称 -- 后38位为文本内容的哈希值)对应上图的35e40c -- tree对象,d6dca9 -- commit对象。只生成一个与commit对象一一对应的顶层tree对象。由于本次提交directory目录下的firsttxt内容没有变化,所以上图的35e40c -- tree对象还会指向f6589b -- tree对象。这个时候HEAD游标指向的是当前master分支的second commit(HEAD索引向前移动),second commit 会指向上一次的提交即 parent指向first commit。

后续的操作以此类推,但需要注意的点是:

1、blob对象只对文件的内容有关,和文件名称无关,如果不同的文件名称,内容相同只会有一个blob对象,生成的新tree对象会指向该blob对象。例如上图的thirdtxt和fourtxt里面的内容都为3。所以不会生成新的blob对象,新的tree对象只会指向同一个blob。

2、如果每次提交的时候包含的某些文件并没有改动(更新),那么就会直接指向它原来的索引,不会重新生成。例如上图的directory/firsttxt,secondtxt

3、每次commit对象都会和顶层的tree对象一一对应。

本文已经收录至我的GitHub,欢迎大家踊跃star

欢迎分享,转载请注明来源:品搜搜测评网

原文地址:https://pinsoso.cn/meirong/2415022.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-12-02
下一篇2023-12-02

随机推荐

  • 精华露和精华液什么区别

    1、两者的质感与适合的肤质以及功能不同。精华液的主要成分由动物、植物或者矿物质等成分组成。精华露是乳液的一种,如果使用了精华露,就不用再使用别的乳液,精华露不适合冬季使用,精华露适合干性或者中性皮肤。2、精华露和精华液的区别在于它们的质感不

    2024-04-15
    43400
  • 天气丹水云系列好用吗

    好用。天气丹套盒里的乳液对于皮肤的维稳效果相当不错,天气丹乳液的质地不厚重,使用起来不会让肌肤产生负担感,保湿力度也很高,适合全肤质所有人群使用。天气丹套盒中还有一盒面霜,天气丹面霜质地比较绵密,可以牢牢锁住之前所使用护肤品中的营养成分。天

    2024-04-15
    37500
  • (爱博新)帕博西尼哌柏西利仿制药有哪种?

    印泰海外健康 商品名:爱博新IBRANCE 通用名:哌柏西利胶囊 英文名称:PalbociclibCapsules 汉语拼音:PaiBoXiLiJiaoNang 哌柏西利成份 本品主要成份为哌柏西利其化学名称为:6-乙酰基-8-环戊基-5

    2024-04-15
    32500
  • 欧珀莱不同系列的使用方法

    欧珀莱时光锁紧致塑颜系列使用方法:一、时光锁紧致塑颜洁面膏打湿面部后,取适量洁面膏于掌心,加少量清水或温水打出丰富泡沫。用泡沫包住面部,轻柔地洗净。充分冲洗干净,以免留有残余。二、时光锁紧致塑颜柔肤水早晚洁面后,取适量柔肤水于美肤棉上,将美

    2024-04-15
    31500
  • 淡斑精华液排行榜10强品牌有哪些

    2019已经过了大半,这一年,无数新功能新类型的精华产品又席卷了护肤圈。精华产品是护肤品中浓度高、效果明显的单品,明白如何正确选择和使用精华液,护肤效果就事半功倍,今天为大家悉心总结2019美白淡斑精华液排行榜10强,从平价到贵妇,总有一款

    2024-04-15
    35100
  • 妮维雅防晒霜怎么样

    为了方便大家理解,小编以来自于旗下的spf30++的这一款蓝色装作为例子来分享,这一款防晒霜它对应的单盒价格为49元,它以突破性的、来自于德国的专利技术作为主基础去打造,所以能有效对抗来自于太阳光中的紫外线照射和伤害,而且还能最大化对抗电脑

    2024-04-15
    34400
  • 妮维雅洗面奶臭臭的正常吗

    妮维雅洗面奶有臭味是正常的吗?这是一个关于妮维雅洗面奶的疑问。我想强调的是,产品是否有臭味可以因个人感知而异。每个人的嗅觉敏感度和对气味的接受程度都不同。所以,我们不能一概而论地说妮维雅洗面奶有臭味就是正常的或者异常的。每个人都可能对同一种

    2024-04-15
    35300

发表评论

登录后才能评论
保存